Lavoce.info

Vite salvate dagli open data

La battaglia contro il coronavirus si combatte anche attraverso analisi statistiche della dinamica dell’epidemia, sulla base delle quali prendere decisioni di politica sanitaria o economica. È indispensabile però che siano resi disponibili dati adeguati.

L’epidemia e il ruolo della statistica

La battaglia alla pandemia Covid-19 si combatte e si vince in molti luoghi: negli ospedali, ovviamente, nei laboratori medici e farmaceutici, nelle fabbriche di materiale per la protezione degli operatori della sanità, nei comuni in lockdown e così via. La battaglia si combatte anche fornendo dati all’opinione pubblica e alla stampa, attraverso una comunicazione onesta ed efficace, che trasmetta la gravità della situazione senza generare panico. A questo devono mirare, in Italia, le quotidiane comunicazioni da parte della Protezione civile e dell’Istituto superiore di sanità.

Ma la battaglia si combatte anche attraverso analisi statistiche della dinamica dell’epidemia, sulla base delle quali prendere decisioni, siano esse di politica sanitaria o di politica economica, fondate su solida e tempestiva evidenza. Queste analisi statistiche, che devono anche indicare i margini di incertezza implicati, necessitano di dati molto più accurati e dettagliati di quelli giornalmente diffusi all’opinione pubblica e alla stampa. I gruppi di lavoro di supporto al governo hanno avuto a disposizione – presumiamo – tutti i dati possibili. Questo ha permesso – speriamo – di dare sostegno alle drastiche e importantissime decisioni prese. Ma se così è, una minima parte di questi dati è stata finora distribuita alla comunità scientifica.

La comunità scientifica – epidemiologi e virologi innanzitutto, ma anche matematici, statistici, informatici e scienziati sociali di ogni tipo (economisti, sociologi, demografi, politologi, giuristi e via dicendo) – ha competenze in principio utilissime allo scopo di combattere l’epidemia. Sono però competenze gettate alle ortiche senza dati accurati per calibrare modelli e stimare parametri e senza stimolare l’interazione tra le varie discipline.

In alcuni casi, come in quello della Lombardia, dati accurati hanno permesso di aiutare la regione nelle proprie decisioni e di pubblicare velocemente contributi scientifici utili anche al resto del mondo. Moltissimo, però, deve ancora essere fatto, in Italia e altrove, per produrre e rendere disponibili all’intera comunità scientifica i dati necessari.

Leggi anche:  L’università italiana continua a non premiare la ricerca*

Ad esempio, come lamentato su queste colonne anche da Giorgio Alleva e Alberto Zuliani, sarebbe fondamentale oggi realizzare anche in Italia analisi campionarie dello sviluppo dell’epidemia. Sarebbe anche utilissimo rendere disponibili microdati individuali riguardo alle caratteristiche demografiche e mediche dei testati, dei contagiati e dei deceduti. Analisi campionarie e microdati individuali sono necessari per stimare con una certa precisione i parametri che controllano la dinamica del contagio e quindi per prevedere gli effetti e l’efficacia di vari possibili interventi a riduzione dei contatti sociali o per identificare strategie di test ottimali.

La stessa recente analisi del MRC Centre for Global Infectious Disease Analysis dell’Imperial College London, un centro di epidemiologia all’avanguardia nel mondo, è basata su dati aggregati e produce di conseguenza previsioni molto imprecise (con largo margine di errore statistico).

Una più esatta stima dei parametri che controllano la dinamica del contagio è necessaria anche per prevedere gli effetti economici delle restrizioni ai movimenti degli individui e all’attività produttiva delle imprese. In brevissimo tempo dallo sviluppo dell’epidemia sono apparsi nella letteratura vari importanti contributi (disponibili qui e qui), che mirano ad esempio alla combinazione di modelli epidemiologici ed economici, con l’uso di tecniche statistiche sofisticate, per prevedere la dinamica del contagio e dei costi economici delle misure che si sono e possono essere intraprese per contenerlo . Ma la sofisticazione teorica dei modelli e dell’analisi statistica nulla può contro dati inadeguati e le analisi e le previsioni che si ottengono sono estremamente imprecise.

Il buon esempio del Canada

Esempi di attenzione virtuosa del sistema politico alla produzione e distribuzione di dati di qualità però esistono. Il Canada, ad esempio, ha avuto un approccio di questo tipo, diffondendo microdati a livello individuale e resi anonimi su ciascun singolo caso confermato di Covid-19. Ad esempio, il caso identificato con il numero 1 nel database si riferisce a una donna, in età tra 20 e 39 anni, esposta attraverso la “comunità” (senza aver viaggiato o aver avuto contatti con chi ha viaggiato nei 14 giorni prima dell’apparizione della malattia), non ospedalizzata.

Leggi anche:  Perché Immuni non piace

Bisogna dire che Statistics Canada (l’Istat canadese) ha una solida tradizione nella distribuzione dei microdati aperta a tutti, anche a chi sta dall’altra parte del mondo. Inoltre il governo canadese appoggia questo approccio, ad esempio lanciando un finanziamento veloce per progetti di ricerca sul Covid-19, purché si impegnino a condividere i dati e i risultati di una ricerca secondo uno schema elaborato dal Wellcome Trust.

Verso gli open data? Speriamo

Le informazioni dettagliate pubblicate da Statistics Canada permettono a chiunque, e a maggior ragione a chi ha una preparazione scientifica, di fornire analisi che possono essere utili a combattere l’epidemia. I microdati consentono di far lavorare, anche in concorrenza tra loro, le menti migliori che vogliano partecipare a questa sfida importante. Soprattutto se stimolate da finanziamenti, consentono di costruire quelle squadre con conoscenze derivate da più discipline necessarie per rispondere alle grandi sfide del nostro tempo.

Le analisi della comunità scientifica su dati accurati sono estremamente utili anche rispetto a un’altra dimensione di primaria importanza: consegnano alla società civile un fondamentale meccanismo indipendente di controllo delle decisioni politiche, tanto più necessario in una situazione di emergenza, dove le decisioni sono necessariamente meno vincolate dai pesi e contrappesi politico-istituzionali. Dati “open” ai ricercatori aiutano a separare il piano dell’evidenza scientifica di supporto alle decisioni politiche dalle decisioni politiche stesse.

È dunque fondamentale che ora, durante l’emergenza, i dati su Covid-19 divengano più “open” possibile. Ma lo sarà ancor di più in futuro, quando usciremo dall’emergenza.

Lavoce è di tutti: sostienila!

Lavoce.info non ospita pubblicità e, a differenza di molte altre testate, l’accesso ai nostri articoli è completamente gratuito. L’impegno dei redattori è volontario, ma le donazioni sono fondamentali per sostenere i costi del nostro sito. Il tuo contributo rafforzerebbe la nostra indipendenza e ci aiuterebbe a migliorare la nostra offerta di informazione libera, professionale e gratuita. Grazie del tuo aiuto!

Precedente

Il Punto

Successivo

Perché va coordinata la risposta al Covid-19*

  1. jerome

    Considerazioni condivisibili, ma, puntualmente:
    IPC “produce di conseguenza previsioni molto imprecise (con largo margine di errore statistico).” rischia di comunicare un messaggio errato. Non si possono fare stime precise in situazione d’incertezza. Fare delle stime con ampi intervalli di fiducia è l’unico modo di essere rigoroso e onesto nel contesto attuale.

    Ossia è proprio perché un’analisi è precisa, nonché rigorosa, che deve avere intervalli di confidenza ampi. Poco precise, rigorose, quelle che comunicherebbero una stima data per sicura.

  2. Andrea Trenta

    Concordo con gli autori, nel linguaggio della qualità dei dati ISO 25000 si potrebbe fare questo esempio:
    S[i](t)= Stato paziente i nel tempo t S=positivo, ricoverato, ricoverato terapia intensiva, deceduto, guarito.
    I passaggi di stato durano giorni

    caratteristica attualità : una parte dei dati del giorno g può essere trasmessa al giorno g+1 o g+2 –> si consiglia media mobile 3 gg

    caratteristica coerenza: uno stesso paziente non può avere nello stesso istante stati diversi, non può essere ripetuto, una volta entrato non può mancare….

    caratteristica accuratezza: supposto 100% (non consideriamo errori di trascrizione o falsi positivi o falsi negativi al tampone)

    caratteristica completezza: si abbassa se manca qualche stato per qualche paziente; all’estremo si può ragionare sulla incompletezza causata dal fatto che ci sono molti positivi senza sintomi (10 ogni positivo censito secondo alcuni studi)

    Per abilitare tali misure si dovrebbe disporre del vettore S[i] che indica lo stato S del paziente i-esimo, il solo dato aggregato (NOTA) non consente tali misure
    Nel caso del Canada è disponibile una struttura dati non aggregata che si avvicina a quella più completa sopra indicata
    NOTA: i dati che vengono pubblicati nella conferenza stampa quotidiana della Protezione Civile, sono sempre in forma aggregata, nel formalismo sopra è ad es.:
    Sum S[i,t] per S=positivo per tutti i pazienti per tutti i giorni (contagiati storici)….etc.

Lascia un commento

Non vengono pubblicati i commenti che contengono volgarità, termini offensivi, espressioni diffamatorie, espressioni razziste, sessiste, omofobiche o violente. Non vengono pubblicati gli indirizzi web inseriti a scopo promozionale. Invitiamo inoltre i lettori a firmare i propri commenti con nome e cognome.

Powered by WordPress & Theme by Anders Norén