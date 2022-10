Problema cronico del nostro paese, la corruzione frutterebbe un giro d’affari di circa 230 miliardi all’anno, secondo alcune stime. L’intelligenza artificiale permette di predire le località più a rischio, rendendo più efficace il contrasto al fenomeno.

Predire i comuni a rischio corruzione: si può?

Stando alla graduatoria più recente di Transparency International, che ordina inversamente 180 paesi del mondo in base a un indice di percezione della corruzione nel settore pubblico e nella politica, l’Italia – seppur rimanendo ben al di sotto della media dei paesi Ue – ha risalito negli ultimi anni molte posizioni, passando dalla 72ma posizione del 2012 alla 42ma del 2021.

Nonostante il balzo, quello della corruzione rimane un problema cronico del nostro paese che, secondo alcune stime, frutta un giro d’affari di circa 230 miliardi di euro all’anno, una cifra molto simile all’importo complessivo dell’intero Piano nazionale di ripresa e resilienza. Proprio riguardo al Pnrr, preoccupano i recenti allarmi sul rischio che la sua attuazione possa essere compromessa da fenomeni di corruzione e malaffare. Come scongiurare i pericoli che la pioggia di risorse sul territorio porta con sé?

Partiamo dai dati. La figura 1 riporta una mappa dei cambiamenti dei tassi di corruzione nei comuni italiani, “fotografati” nell’anno 2012. Già nello scorso decennio, i comuni in cui si registravano incrementi nel numero di “crimini dei colletti bianchi” erano ormai sparsi in tutto il territorio nazionale, anche a causa dello spostamento a Nord delle attività illecite della criminalità organizzata – quella “linea della palma” che Leonardo Sciascia raccontava già ne Il giorno della civetta.

Figura 1 – Cambiamenti dei tassi di corruzione nei comuni italiani (2012)

Nota: La figura riporta in rosso i comuni nei quali il tasso di corruzione annuale (cioè il numero di episodi di corruzione diviso per la popolazione residente) è aumentato rispetto all’anno precedente, e in verde quelli in cui è rimasto invariato o è diminuito. I dati sono riferiti all’anno 2012 e provengono dagli archivi del Ministero dell’Interno (Sistema d’Indagine).

Alla luce dell’impossibilità di tracciare precisi confini geografici all’interno dei quali concentrare gli sforzi investigativi e legislativi, avere a disposizione una mappa delle aree ad alto rischio (hotspot) costituirebbe uno strumento fondamentale per la prevenzione sul territorio.

In un recente lavoro con Guido de Blasio e Alessio d’Ignazio, ci siamo chiesti se è possibile realizzare tale mappa ricorrendo all’uso dell’intelligenza artificiale. Lo studio utilizza algoritmi predittivi ad apprendimento automatico (machine learning) per suggerire in quali comuni italiani è più probabile che avvengano delitti contro la pubblica amministrazione (in particolare, ex articoli 314-323 codice penale) e la fede pubblica (articoli 479-481 codice penale). Vista la loro capacità di produrre previsioni accurate estraendo informazione rilevante dai dati amministrativi, queste tecniche sono ormai impiegate per i fini più disparati, dalla stima degli impatti occupazionali della pandemia, alla previsione dei comuni in dissesto fino all’identificazione delle aree a maggiore esitazione vaccinale.

Utilizzando il dataset Sistema d’indagine del Ministero dell’Interno e un’ampia serie di caratteristiche socio-economiche, demografiche e territoriali, sviluppiamo modelli previsivi in grado di identificare ex-ante le aree ad alto rischio. L’algoritmo che applichiamo nello studio (Albero di classificazione) prevede correttamente l’insorgenza o meno di fenomeni di corruzione per circa l’85 per cento dei comuni italiani. L’accuratezza è di soli 10 punti percentuali più bassa nel predire l’incremento o il decremento annuale dei reati di corruzione.

Il criterio adottato dall’albero decisionale per classificare un comune è riportato nella figura 2. Il modello sfrutta soglie critiche nei valori di poche variabili dall’elevato potere predittivo – alcune delle quali difficili da ipotizzare a priori come rilevanti per il problema. Ad esempio, se la popolazione del comune (p1) è inferiore a 7.361 abitanti ma uguale o superiore a 2.674, la mobilità fuori comune per studio o lavoro (m2) è inferiore al 39 per cento e l’incidenza di famiglie con potenziale disagio economico (v6) è pari o superiore all’1,5 per cento, l’algoritmo prevede che in quel comune la corruzione aumenterà nell’anno successivo.

Figura 2 – Albero di classificazione per la previsione dei comuni a rischio incremento dei reati di corruzione

Nota: Le variabili nell’albero provengono dal database 8milaCensus dell’Istat riferito all’anno 2011. Raggruppando i comuni all’interno del nodo terminale di appartenenza sulla base dei valori soglia identificati, il modello classifica i comuni nei quali l’anno successivo il tasso di corruzione aumenterà (valore nodo terminale uguale a 1) oppure no (valore nodo terminale uguale a 0).

Intelligenza artificiale e lotta alla corruzione

Come utilizzare queste previsioni? Sfruttandole per migliorare il targeting, ovvero l’identificazione dei destinatari “ottimali”, delle politiche anticorruzione. Ad esempio, abbiamo confrontato le previsioni dei nostri modelli con un criterio adottato nell’ambito dell’attuazione della legge Severino del 2012. Oltre alle disposizioni generali, il decreto legislativo n.39 del 2013 prevedeva infatti l’applicazione di ulteriori norme specifiche solamente per i comuni con una popolazione superiore ai 15 mila abitanti. Quale che sia la ratio della scelta, sottintende il giudizio che le aree più popolate siano quelle a maggior rischio.

I risultati del confronto sono mostrati nella tabella 1. La soglia identifica meno della metà dei comuni in cui la corruzione aumenta; l’algoritmo ne predice correttamente l’80 per cento. Chiaramente, l’utilità dell’esercizio dipende dalla possibilità di fotografare il quadro attuale – non passato – del fenomeno a livello locale. Sebbene, a causa di vincoli di disponibilità, il nostro studio sia stato condotto su dati dello scorso decennio e con un numero di variabili esplicative inferiore a quello potenzialmente accessibile ai governanti, replicare l’esercizio con dati più recenti e abbondanti sarebbe immediato.

L’uso di algoritmi per importanti scelte legislative e politiche si accompagna a delicati problemi di trasparenza, riservatezza, interpretabilità e accountability del decisore pubblico. Ne abbiamo avuto un esempio con le polemiche che hanno segnato l’utilizzo dei 21 indicatori scelti durante la pandemia per stabilire i cambi di zona e i livelli di restrizione delle regioni italiane. Proprio per questo abbiamo optato per un algoritmo che è fra i più trasparenti in assoluto, in quanto consente intuitivamente di comprendere la regola decisionale alla base del modello.

In conclusione, le politiche anticorruzione potrebbero giovarsi di una mappa granulare delle località a rischio realizzata attraverso accurati – ma non eccessivamente complessi – modelli statistici. Sfruttare tutte le informazioni e tecnologie disponibili per individuare i territori in cui è più probabile che vengano commessi reati di corruzione potrebbe rappresentare un deciso miglioramento per le attività investigative e repressive. Entrando pienamente nell’era dei big data e dell’intelligenza artificiale, la lotta alla corruzione può diventare più efficace ed efficiente.