Chi fa ricerca in Italia si trova ad affrontare la carenza di dati statistici individuali, informazioni dettagliate su ciascuno degli individui considerati, rese opportunamente anonime secondo la vigente normativa sulla privacy. Ora, la distribuzione on line dei dati provenienti dagli archivi Inps è presentata come un primo passo per ovviare a questa situazione. E’ certamente un’iniziativa interessante, ma si limita alla diffusione di numeri aggregati. Con il rischio che finisca per sostituire o rallentare il processo di distribuzione dei microdati.

Iniziative come quella descritta nell’articolo di Salvatore Pirrone e Paolo Sestito  sono certamente meritorie, soprattutto quando promettono la diffusione dei dati individuali.
Per chi fa ricerca, infatti, la carenza di dati statistici in Italia, di cui si è ampiamente parlato su questo sito, si riferisce principalmente ai dati individuali.
La distribuzione on line dei dati provenienti dagli archivi Inps è sicuramente interessante, ma si limita alla diffusione di numeri aggregati (ovvero, per utilizzare l’esempio di Pirrone e Sestito, quanti lavoratori in un certo periodo passano dalla mobilità a un contratto di lavoro e così via), mentre quello che realmente manca in Italia sono i dati individuali, informazioni dettagliate su ognuno di questi individui, opportunamente anonimizzati secondo la vigente normativa sulla privacy.

L’interpretazione “unica”

Distribuire i microdati è davvero l’unico modo per garantire la trasparenza dell’informazione statistica. I siti come quello descritto da Pirrone e Sestito, nel momento in cui vincolano l’utente a produrre tavole incrociate utilizzando solo alcune variabili, già propongono un’interpretazione dei dati, o meglio, non consentono di vederne altre. Faccio un esempio: i dati presentati nell’articolo indicano che il 28 per cento dei lavoratori che erano in mobilità nel primo trimestre del 1999 erano occupati dipendenti alla fine del 2000. Sarebbe utile sapere però a quale salario hanno trovato lavoro. Ovvero, hanno trovato lavoro perché le condizioni di mercato sono migliorate, oppure perché dopo quasi due anni di mobilità hanno deciso di accettare un salario più basso?

Leggi anche:  L’investimento in ricerca? Dipende dalla forma di governo

I possibili pericoli

Se dunque l’obiettivo finale è quello di distribuire l’archivio individuale (come giustamente Pirrone e Sestito sottolineano nel loro intervento), mi chiedo se queste iniziative di distribuzione dei dati aggregati non presentino anche qualche svantaggio.
Per esperienza personale, che credo sia rappresentativa di quella di molti giovani ricercatori italiani, noto che la creazione di siti di distribuzione di dati aggregati viene spesso usata come giustificazione per non distribuire i dati individuali. Ci si sente spesso dire che i dati sono disponibili su Internet, salvo poi scoprire che più di qualche tavola incrociata non si può produrre.
Esiste il rischio che la creazione di questi siti chiuda il processo di distribuzione dei dati, lo archivi come cosa fatta. È il caso degli osservatori dell’Inps, del laboratorio Adele (un’iniziativa un po’ diversa, ma che è altrettanto spesso usata come giustificazione per non distribuire moltissime banche dati), dell’indagine Excelsior di Unioncamere, e così via. Detto in parole diverse, temo che queste iniziative, pur volendo essere un passo avanti nel raggiungimento dell’obiettivo finale di distribuire i microdati, corrano il rischio invece di diventarne un sostituto o di rallentarne il processo di distribuzione.
Se i timori sono fondati, allora i costi (non irrisori, suppongo) sostenuti per la creazione di questi siti sarebbero probabilmente meglio spesi semplicemente per distribuire i microdati. Infatti, per la produzione delle tavole nel sito è necessario che l’archivio originale individuale sia già esistente e “pulito”, ovvero pronto per le elaborazioni. E dunque non sarebbe più semplice, efficace e economico distribuire direttamente i microdati?
Con un utilizzo diffuso dei dati individuali, anche chi è interessato solo ad alcuni numeri aggregati (penso a potenziali utenti del sito come i giornalisti) troverebbe con facilità qualcuno che li produca.

I dati e la privacy

Spesso alla distribuzione dei dati individuali si oppongono questioni di privacy e riservatezza. Tuttavia, se interpreto correttamente la nuova normativa, non mi sembra che la distribuzione dei microdati degli archivi Inps ponga problemi di privacy insormontabili.
Credo invece che esista un più profondo problema di approccio al mondo della ricerca: la nuova normativa è in vigore da diversi mesi e, che io sappia, a oggi è stata “utilizzata” pochissimo. Solo i dati longitudinali delle forze di lavoro dell’Istat, che secondo le vecchia normativa non potevano essere distribuiti, sono oggi accessibili.
Abbiamo faticato tanto, come comunità scientifica, per ottenere una legge più liberale, oggi dobbiamo usarla e dobbiamo puntare alla distribuzione dei microdati, non accontentarci di numeri aggregati. Ben vengano le iniziative come quelle di Pirrone e Sestito, ma stiamo attenti che non diventino un ostacolo, invece che un passo avanti verso la distribuzione dei dati individuali.

Leggi anche:  Il 5G corre, ma sulla rete neutrale


 

Lavoce è di tutti: sostienila!

Lavoce.info non ospita pubblicità e, a differenza di molte altre testate, l’accesso ai nostri articoli è completamente gratuito. L’impegno dei redattori è volontario, ma le donazioni sono fondamentali per sostenere i costi del nostro sito. Il tuo contributo rafforzerebbe la nostra indipendenza e ci aiuterebbe a migliorare la nostra offerta di informazione libera, professionale e gratuita. Grazie del tuo aiuto!