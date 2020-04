La costruzione stessa del campione fa sì che i dati Istat di inizio aprile non possano essere usati per stimare il numero totale di decessi causati da Covid-19. Né oggi si può sostenere che i numeri indicati dal ministero della Salute siano sottostimati.

Cosa dicono davvero i dati Istat

Qualche giorno fa l’Istat ha pubblicato i dati relativi ai decessi negli anni dal 2015 al 2020 nelle settimane dal 1° gennaio al 21 marzo. Nella nota esplicativa, l’Istat spiega che si riferiscono a 1.084 dei 5.866 comuni italiani inclusi nell’Anagrafe nazionale della popolazione residente (Anpr). Sono i “comuni con un numero di decessi che, nel periodo 1° gennaio – 21 marzo 2020, è risultato superiore o uguale a 10 unità e che nel mese di marzo del 2020 hanno presentato, rispetto alla corrispondente media del quinquennio 2015-2019, un incremento della mortalità pari ad almeno il 20 per cento”.

Nei giorni successivi, vari commentatori hanno utilizzato questi dati per stimare il numero dei decessi causati da Covid-19, giungendo alla conclusione che l’epidemia ha provocato molti più decessi di quelli ufficialmente riconosciuti dal ministero della Salute, approssimativamente il doppio. Non sorprende che la notizia abbia avuto grande rilevanza anche sui media internazionali.

Nell’articolo pubblicato qualche giorno fa abbiamo mostrato che le cose non stanno così. Applicando la regola di selezione usata dall’Istat ai dati relativi alle settimane del 2020 dal 1° al 22 febbraio – sono quelle che precedono l’inizio dell’epidemia – si ottiene un gruppo di comuni (circa 250) che anche in quelle settimane registrano una variazione rilevante dei decessi del 2020 rispetto alla media dei cinque anni precedenti. È una variazione nell’ordine del 40 per cento. Si tratta di una differenza del tutto assente nell’insieme originario del 1.084 comuni. Dunque – questa è la nostra tesi – è dovuta solo al modo in cui sono stati selezionati quei 250 comuni dai 1.084 del campione Istat.

Abbiamo concluso che è plausibile che la stessa selezione dei 1.084 comuni operata dall’Istat sui 5.866 dell’Anpr soffra dello stesso problema di (grave) sovrastima della variazione dei decessi nel 2020 rispetto alla media dei cinque anni precedenti.

La selezione del campione

L’articolo ha dato luogo a varie obiezioni, nella sostanza riassumibili in due affermazioni: 1) la nostra analisi si riferisce solo ai 1.084 comuni già selezionati dall’Istat, non a tutti i 5.866 dell’Anpr; 2) l’analisi si riferisce alle settimane immediatamente precedenti l’inizio dell’epidemia e potrebbe quindi essere falsata dalla prossimità temporale a questa.

Secondo noi ci sono buone ragioni per ritenere che entrambe le critiche non siano rilevanti. Ma, in questi casi, la strategia migliore per convincere gli scettici è mostrare che i risultati sono gli stessi cambiando l’insieme di comuni di riferimento e il periodo.

Abbiamo considerato tutti i comuni italiani per gli anni dal 2015 al 2019. La riga 1 della tabella mostra il numero totale di decessi nelle settimane dal 22 febbraio al 21 marzo, separatamente per i cinque anni. Non ci sono, ovviamente, particolari anomalie da segnalare: in quelle quattro settimane del 2019 non è successo nulla di significativo rispetto alle corrispondenti settimane dei quattro anni precedenti.

Tabella 1





Il passo successivo consiste nel selezionare tra i 7.904 comuni solo quelli “con un numero di decessi che, nel periodo 1° gennaio – 21 marzo 2019, è risultato superiore o uguale a 10 unità e che nel mese di marzo del 2019 hanno presentato, rispetto alla corrispondente media del quadriennio 2015-2018, un incremento della mortalità pari ad almeno il 20 per cento”. In altre parole, abbiamo applicato la stessa regola di selezione usata dall’Istat, adattata al quinquennio 2015-2019.

Su questo sottoinsieme, costituito da 1.265 comuni (che corrispondono al 16 per cento dei comuni italiani), abbiamo contato il numero di decessi nelle solite settimane, separatamente per i cinque anni. In riga 2 della tabella si osserva che il numero di decessi del 2019 risulta essere del 52 per cento superiore rispetto alla media relativa allo stesso periodo nei quattro anni precedenti.

Sorprendente? Per niente. Se si considerano solo i comuni nei quali la variazione dei decessi è stata pari ad almeno il 20 per cento, in quei comuni si osserverà una variazione almeno pari al 20 per cento. Di fatto, ne vediamo una molto superiore al 20 per cento perché, per effetto della variabilità accidentale del numero dei decessi tra i comuni selezionati,ce ne sono alcuni con variazioni considerevolmente più elevate.

Banalizzando, se si vuole misurare l’altezza media di una popolazione, non è una buona idea prendere l’altezza delle persone presenti nello spogliatoio di una partita di basket.

La nostra conclusione è semplice. I dati pubblicati dall’Istat a inizio aprile non possono essere usati per stimare – nemmeno in via approssimativa – il numero totale di decessi causati da Covid-19. In questo senso, non ci sorprende minimamente che l’Istituto di statistica – consapevole delle caratteristiche del campione di comuni selezionato – nella sua nota a commento dei dati abbia accuratamente evitato di farlo.

Purtroppo, molti altri l’hanno fatto, accreditando l’idea che il numero totale di decessi da Covid-19 fornito dal ministero sia fortemente sottostimato. Per il momento, non c’è alcuna ragione seria per sostenerlo.