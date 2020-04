I dati resi disponibili dall’istituto di statistica riguardano solo i comuni in cui l’aumento della mortalità è stato più significativo. Cambiando approccio si ottengono numeri non così distanti da quelli forniti dal ministero della Salute.

Una questione di campioni

L’Istat ieri ha reso disponibili i dati sui decessi al dettaglio comunale tratti dall’Anagrafe nazionale della popolazione residente (Anpr) che include a oggi 5.866 comuni. Nella sua nota esplicativa, l’Istat spiega che i dati si riferiscono a 1.084 comuni: sono quelli “con un numero di decessi che, nel periodo dal 1° gennaio al 21 marzo 2020, è risultato superiore o uguale a 10 unità e che nel mese di marzo del 2020 hanno presentato, rispetto alla corrispondente media del quinquennio 2015-2019, un incremento della mortalità pari ad almeno il 20 per cento”.

La tabella 1 riporta il numero di decessi negli anni dal 2015 al 2020 separatamente per le settimane dal 1° gennaio al 22 febbraio (riga 1) e per le settimane dal 23 febbraio al 21 marzo (riga 2). Tenendo conto dell’andamento osservato nelle settimane dal 1° gennaio al 22 febbraio, risulta in modo macroscopico un aumento dei decessi nelle quattro settimane dell’epidemia di Covid-19, nell’ordine di almeno 10 mila decessi in più rispetto a quanto osservato negli anni precedenti.

Un numero di decessi nettamente superiore ai 4.825 attribuiti a Covid-19, comunicati a quella data dal ministero della Salute.

Tabella 1. Decessi osservati dal 2015 al 2020 distintamente per le settimane dal 1° gennaio al 22 febbraio e dal 23 febbraio al 21 marzo.



Elaborazioni dell’autore. Il campione ristretto include solo i comuni che nelle settimane dal 1/1 al 22/2 hanno registrato una variazione dei decessi rispetto alla media degli anni precedenti almeno pari al 20 per cento.

Ci sono però almeno un paio di ragioni per interpretare con molta cautela lo scostamento tra il dato ufficiale del ministero e la stima che proviene dai dati Istat.

Innanzitutto, in linea di principio la selezione del campione operata dall’Istat dà luogo a una sovrastima sistematica della variazione dei decessi osservata nelle quattro settimane “calde” del 2020 rispetto alle corrispondenti settimane degli anni precedenti. Infatti, anche se – in ipotesi – l’effetto dell’epidemia sui decessi fosse nullo, questa regola di selezione includerebbe nel campione solo i comuni che per effetto delle oscillazioni casuali del fenomeno in quelle quattro settimane hanno registrato una variazione positiva pari ad almeno il 20 per cento sulla media degli anni precedenti. Ed escluderebbe invece dal campione tutti i comuni con variazioni dovute al caso inferiori a quella soglia.

Che questa distorsione sia effettivamente rilevante è un problema empirico, non teorico. Per avere un’idea, almeno approssimativa, dell’entità di questa distorsione abbiamo applicato la stessa regola di selezione usata dall’Istat al dato relativo al numero di decessi nelle prime sette settimane del 2020. Abbiamo cioè escluso dal campione i comuni che in quelle settimane hanno registrato un aumento nel numero di decessi inferiore al 20 per cento rispetto alla media degli anni precedenti. Nel sottoinsieme di comuni così ottenuto l’andamento dei decessi nei sei anni considerati è riportato nella terza riga della Tabella 1. Si nota che solo per effetto del modo in cui è stato selezionato questo sottoinsieme di comuni, nelle prime sette settimane del 2020 il numero dei decessi risulta superiore circa del 40 per cento a quello delle corrispondenti settimane degli anni precedenti.

Conclusioni

Montando i vari pezzi assieme, si ricava che dei circa 10 mila decessi in più rispetto agli anni precedenti osservati nelle settimane dal 23 febbraio al 21 marzo del 2020, 4 mila circa potrebbero essere dovuti al modo in cui l’Istat ha selezionato il campione. Secondo questi calcoli, i rimanenti 6 mila decessi sarebbero effettivamente da attribuire a Covid-19: in tal caso lo scostamento tra il dato ufficiale del Ministero e la stima basata sui dati Istat si ridurrebbe a circa mille unità.

A complicare – anche se forse in modo non rilevante – il confronto tra le due stime, c’è da tenere anche in considerazione che il dato ufficiale del ministero include anche i decessi avvenuti nei comuni esclusi dal campione Istat. In questo senso la stima basata su quest’ultimo è potenzialmente distorta al ribasso. Anche se, stante la regola di selezione adottata dall’Istat, è plausibile che si tratti di una sottostima dall’entità contenuta.

Come si evince dai due grafici qui sotto, poi, anche se il dato comunicato dal ministero fosse inferiore a quello corretto, la tendenza verrebbe comunque colta in modo soddisfacente. La figura 1 propone l’andamento dei decessi nelle prime 11 settimane del 2020 (linea blu; il primo dato si riferisce ai primi 11 giorni dell’anno) e per confronto il corrispondente andamento medio nei cinque anni precedenti (linea arancione). Evidente la progressiva forte divaricazione delle due linee nelle ultime quattro settimane. La figura 2 riporta invece la differenza tra le due linee in figura 1: leggermente negativa nelle prime sette settimane dell’anno, poi positiva e progressivamente crescente. La linea arancione rappresenta i decessi nelle prime quattro settimane dell’epidemia secondo i dati forniti dal Ministero e, pur rimanendo sistematicamente sotto la linea blu, ne segue in modo accettabile l’andamento.

Figura 1. Numero di decessi nelle prime undici settimane dell’anno nel 2020 (linea blu); numero medio di decessi nelle corrispondenti settimane dei cinque anni precedenti (linea arancione).



Figura 2. Differenza tra decessi 2020 e media decessi 2015-2019 nelle prime undici settimane dell’anno (linea blu); decessi secondo le comunicazioni ufficiali del ministero della Salute nelle prime quattro settimane dell’epidemia (linea arancione).