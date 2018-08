Social network, web o carte fedeltà generano un immenso archivio di dati estremamente interessanti per le aziende. I professionisti in grado di “leggerle” sono pochi e molto ricercati. Tanta pratica e competenze multidisciplinari nel loro apprendimento.

Una marea di dati per le aziende

L’utilizzo dei social network, del web e dei processi automatici/digitali (ad esempio gli acquisti su un sito di e-commerce o gli scontrini di un supermercato connessi alla carta fedeltà) generano un immenso archivio di dati. Lo “tsunami” di informazione cresce vertiginosamente se analizzato con intelligenza, consente di raccontare i gusti, le abitudini e le tendenze della società e quindi di pianificare politiche pubbliche o piani di marketing.

I comportamenti umani si trasformano in “big-data”, la cui analisi si riversa a sua volta in strategie aziendali. Avviene attraverso lo studio delle reti neurali artificiali (artificial neural networks) o dell’apprendimento automatico (machine learning) che fanno parte di quella branca della intelligenza artificiale cresciuta negli ultimi anni grazie soprattutto al miglioramento della potenza di calcolo e nella capacità analitica di affinare le tecniche di stima, di classificazione e di previsione del dato.

Lo “tsunami” dei dati è una vera miniera d’oro, basta saperla sfruttare. Per questo sempre più aziende (di grandi e piccole dimensioni) manifestano l’esigenza di assumere figure professionali specializzate (noti come data scientist o data analyst), in grado di maneggiare ed estrapolare informazioni a supporto dei processi decisionali.

Si tratta di una professione emergente, in Italia nel 2017 ne sono stati assunti circa 1.500, il suo obiettivo non è solo quello di organizzare e analizzare grandi quantità di dati, ma soprattutto garantire analisi abbastanza semplici da essere comprese da tutti gli attori coinvolti. Una figura che richiede quindi competenze multidisciplinari (statistiche, matematiche ed economiche): deve essere in grado di estrarre dati da database MySQL, gestire gli Analytics, sviluppare algoritmi di ottimizzazione e disporre di sufficienti competenze in ambito business per migliorare le abilità di debug.

Il problema, non solo italiano, è che al momento ci sono più dati che persone competenti, per questo il data scientist è una delle professioni più richieste nel mercato del lavoro.

Come si forma un data scientist?

Da alcuni anni le università hanno avviato corsi specifici, ma il numero di persone che li frequenta resta troppo basso rispetto al tasso di crescita della domanda, per questo molti paesi cercano di sfruttare le sinergie fra insegnamento universitario e apprendimento a distanza.

Uno dei casi più noti è quello del professor Balaraman Ravindran in India, che tiene i suoi corsi tramite una piattaforma governativa che consente successivamente agli studenti di sostenere gli esami di persona in diverse parti del paese, guadagnando una certificazione formale riconosciuta in ambito lavorativo.

Altre piattaforme ospitano corsi on-line di diverso livello, spesso con un approccio pratico alla scrittura di routine analitiche di immediato utilizzo, ovviamente in rete è disponibile moltissimo materiale in forma gratuita (come ad esempio la possibilità di vedere i corsi tenuti da Jeremy Howard e Rachel Thomas) così come open source sono i principali linguaggi e librerie (R e Python).

L’obbiettivo dichiarato di iniziative come Fast.ai negli Usa e Nptel in India è quello di allargare la base di persone competenti, in modo da generare una “massa critica” che consenta di far avanzare la ricerca nello studio dei big data.

A tale scopo si svolgono anche le competizioni a premio a cui tutti possono partecipare. I premi sono banditi da imprese che attraverso specifiche piattaforme (come Kaggle), mettono a disposizione i loro dati, presentano i problemi che intendono risolvere e pagano (spesso con migliaia di dollari) le persone e i team che presentano risultati migliori (valutati con metriche oggettive). Kaggle offre gratuitamente anche potenza di calcolo on-line per gli utenti meno dotati di risorse tecniche proprie. Non è quindi necessario possedere calcolatori potenti per partecipare, quello che viene premiato è la capacità analitica o, se si preferisce, la competenza.

Attraverso queste competizioni le imprese acquisiscono soluzioni ai loro problemi e gli analisti si scambiano informazioni e tecniche che vengono condivise con tutta la comunità on-line. Pertanto, la diffusione della conoscenza avviene attraverso la formazione di una élite selezionata all’interno di una competizione aperta a tutti e non attraverso una selezione scolastica che risulterebbe troppo restrittiva.

Come un violinista, serve pratica

Tutte le grandi imprese stanno investendo cifre rilevanti nella tecniche di intelligenza artificiale in grado gestire lo “tsunami” dei dati, per questo sono alla “disperata” ricerca di giovani data scientist, i quali sono frutto di un mix formativo (naturalmente il tutto in lingua inglese): frequentazione delle comunità di pratica, apprendimento in imprese a elevata tecnologia, condivisione di risorse di calcolo, formazione on-line gratuita e a pagamento, spesso in sinergia con corsi universitari.

Come ricorda Jeremy Howard su Fast.ai, nessuno ti insegna a usare il violino tenendoti in aula a spiegarti la teoria del suono e della musica per anni. Ti mettono il violino in mano e ti fanno fare pratica, puoi mettere in pratica la teoria mentre la studi. Se ti mettessero il violino in mano dopo anni di studio teorico, è chiaro che non lo sapresti suonare.

La regola vale anche per la matematica o per ogni altro apprendimento, pertanto se intendiamo sviluppare anche in Italia la figura del data scientist è opportuno valutare attentamente quali possono essere le migliori azioni da compiere, tra queste la possibilità di favorire anche meccanismi “competitivi” come la piattaforma Kaggle.

* Le opinioni espresse non coinvolgono l’istituzione di appartenenza.