Lavoce.info

Professione data scientist

Social network, web o carte fedeltà generano un immenso archivio di dati estremamente interessanti per le aziende. I professionisti in grado di “leggerle” sono pochi e molto ricercati. Tanta pratica e competenze multidisciplinari nel loro apprendimento.

Una marea di dati per le aziende

L’utilizzo dei social network, del web e dei processi automatici/digitali (ad esempio gli acquisti su un sito di e-commerce o gli scontrini di un supermercato connessi alla carta fedeltà) generano un immenso archivio di dati. Lo “tsunami” di informazione cresce vertiginosamente se analizzato con intelligenza, consente di raccontare i gusti, le abitudini e le tendenze della società e quindi di pianificare politiche pubbliche o piani di marketing.

I comportamenti umani si trasformano in “big-data”, la cui analisi si riversa a sua volta in strategie aziendali. Avviene attraverso lo studio delle reti neurali artificiali (artificial neural networks) o dell’apprendimento automatico (machine learning) che fanno parte di quella branca della intelligenza artificiale cresciuta negli ultimi anni grazie soprattutto al miglioramento della potenza di calcolo e nella capacità analitica di affinare le tecniche di stima, di classificazione e di previsione del dato.

Lo “tsunami” dei dati è una vera miniera d’oro, basta saperla sfruttare. Per questo sempre più aziende (di grandi e piccole dimensioni) manifestano l’esigenza di assumere figure professionali specializzate (noti come data scientist o data analyst), in grado di maneggiare ed estrapolare informazioni a supporto dei processi decisionali.

Si tratta di una professione emergente, in Italia nel 2017 ne sono stati assunti circa 1.500, il suo obiettivo non è solo quello di organizzare e analizzare grandi quantità di dati, ma soprattutto garantire analisi abbastanza semplici da essere comprese da tutti gli attori coinvolti. Una figura che richiede quindi competenze multidisciplinari (statistiche, matematiche ed economiche): deve essere in grado di estrarre dati da database MySQL, gestire gli Analytics, sviluppare algoritmi di ottimizzazione e disporre di sufficienti competenze in ambito business per migliorare le abilità di debug.

Il problema, non solo italiano, è che al momento ci sono più dati che persone competenti, per questo il data scientist è una delle professioni più richieste nel mercato del lavoro. 

Leggi anche:  Arrivano gli Eurobond e hanno un carattere sociale

Come si forma un data scientist?

Da alcuni anni le università hanno avviato corsi specifici, ma il numero di persone che li frequenta resta troppo basso rispetto al tasso di crescita della domanda, per questo molti paesi cercano di sfruttare le sinergie fra insegnamento universitario e apprendimento a distanza.

Uno dei casi più noti è quello del professor Balaraman Ravindran in India, che tiene i suoi corsi tramite una piattaforma governativa che consente successivamente agli studenti di sostenere gli esami di persona in diverse parti del paese, guadagnando una certificazione formale riconosciuta in ambito lavorativo.

Altre piattaforme ospitano corsi on-line di diverso livello, spesso con un approccio pratico alla scrittura di routine analitiche di immediato utilizzo, ovviamente in rete è disponibile moltissimo materiale in forma gratuita (come ad esempio la possibilità di vedere i corsi tenuti da Jeremy Howard e Rachel Thomas) così come open source sono i principali linguaggi e librerie (R e Python).

L’obbiettivo dichiarato di iniziative come Fast.ai negli Usa e Nptel in India è quello di allargare la base di persone competenti, in modo da generare una “massa critica” che consenta di far avanzare la ricerca nello studio dei big data.

A tale scopo si svolgono anche le competizioni a premio a cui tutti possono partecipare. I premi sono banditi da imprese che attraverso specifiche piattaforme (come Kaggle), mettono a disposizione i loro dati, presentano i problemi che intendono risolvere e pagano (spesso con migliaia di dollari) le persone e i team che presentano risultati migliori (valutati con metriche oggettive). Kaggle offre gratuitamente anche potenza di calcolo on-line per gli utenti meno dotati di risorse tecniche proprie. Non è quindi necessario possedere calcolatori potenti per partecipare, quello che viene premiato è la capacità analitica o, se si preferisce, la competenza.

Attraverso queste competizioni le imprese acquisiscono soluzioni ai loro problemi e gli analisti si scambiano informazioni e tecniche che vengono condivise con tutta la comunità on-line. Pertanto, la diffusione della conoscenza avviene attraverso la formazione di una élite selezionata all’interno di una competizione aperta a tutti e non attraverso una selezione scolastica che risulterebbe troppo restrittiva.

Leggi anche:  Reti di servizio per la “materializzazione” di Internet

Come un violinista, serve pratica

Tutte le grandi imprese stanno investendo cifre rilevanti nella tecniche di intelligenza artificiale in grado gestire lo “tsunami” dei dati, per questo sono alla “disperata” ricerca di giovani data scientist, i quali sono frutto di un mix formativo (naturalmente il tutto in lingua inglese): frequentazione delle comunità di pratica, apprendimento in imprese a elevata tecnologia, condivisione di risorse di calcolo, formazione on-line gratuita e a pagamento, spesso in sinergia con corsi universitari.

Come ricorda Jeremy Howard su Fast.ai, nessuno ti insegna a usare il violino tenendoti in aula a spiegarti la teoria del suono e della musica per anni. Ti mettono il violino in mano e ti fanno fare pratica, puoi mettere in pratica la teoria mentre la studi. Se ti mettessero il violino in mano dopo anni di studio teorico, è chiaro che non lo sapresti suonare.

La regola vale anche per la matematica o per ogni altro apprendimento, pertanto se intendiamo sviluppare anche in Italia la figura del data scientist è opportuno valutare attentamente quali possono essere le migliori azioni da compiere, tra queste la possibilità di favorire anche meccanismi “competitivi” come la piattaforma Kaggle.

* Le opinioni espresse non coinvolgono l’istituzione di appartenenza.

Lavoce è di tutti: sostienila!

Lavoce.info non ospita pubblicità e, a differenza di molte altre testate, l’accesso ai nostri articoli è completamente gratuito. L’impegno dei redattori è volontario, ma le donazioni sono fondamentali per sostenere i costi del nostro sito. Il tuo contributo rafforzerebbe la nostra indipendenza e ci aiuterebbe a migliorare la nostra offerta di informazione libera, professionale e gratuita. Grazie del tuo aiuto!

Precedente

Di che colore è il governo Conte

Successivo

L’Italia delle decisioni opache *

  1. Mattia Perrone

    Esistono corsi online anche in Italia?

    • Dunning Kruger

      Alcuni Consigli per iniziare:

      – Uno dei software piú utilizzati per l’analisi del Big Data é “Splunk”: https://www.splunk.com/. Tra gli strumenti di training dispone di un paio di tutorial online (cartaceo e video) e soprattutto permette di utilizzare una versione di studio del software con tanto di base dati di test. Consigliato per avere un’idea e una prima pratica di come funziona un moderno ambiente di gestione dati massivi. Si puo anche conseguire una certificazione gratuita che, pur essendo di livello base, giá distacca parecchio (La professionale costa sui 2000 euro, tanti ma non troppi se uno vuole investire su questa carriera)

      – Altro consiglio é avere almeno un’infarinatura di statistica: la maniera piú semplice é seguire la serie dedicata nel canale youtube di “Crash Course”: https://www.youtube.com/watch?v=zouPoc49xbk&list=PL8dPuuaLjXtNM_Y-bUAhblSAdWRnmBUcr.

      – Altra abilitá principale é sapere cosa sono le “Regular Expressions” e come funzionano: le risorse principali per professionisti e principianti sono http://www.rexegg.com/ (per la documentazione) e https://regex101.com/ (per i test).

      Tutto questo é materiale gratutio che peró é disponibile solo in inglese (altra abilitá vitale per intraprendere questa carriera) poi dipende dall’area di expertise che si vuole sviluppare: l’IoT ha regole differenti dal Machine Learning che é tutta un’altra storia rispetto al Social Engineering.

      Buono Studio! 😉

    • Alex

      Mattia chiamami posso darti delle info sono molto interessato e vorrei creare un team di esperti in analisi dei big data mi trovi al 3400878160

  2. Henri Schmit

    Non dubito minimamente dell’immenso potenziale dei (big) data. L’opportunità e eventuali rischi non sono ovviamente limitati al settore commerciale, Cambridge Analyctica insegna. Nel campo prettamente commerciale le strategie di successo non dipendono tuttavia dal data analyst ma dalla capacità sintetica e intuitiva di coloro che definiscono i concetti, i parametri dell’analisi. Penso al settore concreto dell’informazione raccolta con carte di fedeltà nel settore farmaceutico; devo decidere quali dati raccogliere e dopo l’analisi quali azioni intraprendere; siamo in un cerchio, la data analysis è solo uno strumento subalterno. Ovviamente chi dispone di più dati (settoriali, geografici) – il distributore grossista piuttosto che la farmacia – vede e capisce di più. Domani il problema sarà di decidere chi ha accesso a quali dati.

  3. Michele

    Nel sommario, “Il punto” come viene chiamato, viene accostata la figura del data scientist con il Decreto Dignità. Ma cosa c’entra? Propaganda a parte, i due temi non hanno nulla in comune. Perché scrivere che il governo “dimentica le nuove professioni richieste dalla tecnologia”? Dobbiamo prevedere norme ad hoc per ogni nuova professione che ci si inventa? Mi sembra un accostamento molto sforzato che sembra dettato da uno spirito di propaganda. Cosa che mi dispiace in quanto ho sempre apprezzato lavoce.info per lo sforzo di essere oggettivo e non di parte politica

  4. Alex

    l’analisi dei big data è senza dubbio interessante in Italia esistono corsi, Azure è un software che sarà veramente l’applet più utilizzato pe l’analisi dei big data?
    grazie

  5. Marco Vischioni

    Tutto molto vero e coerente, ma sarebbe anche il caso di trovare un modo per mettere in regola i circa 2 milioni di operatori del settore sportivo (dati sole24ore) che continuano a stare in un limbo normativo.

Lascia un commento

Non vengono pubblicati i commenti che contengono volgarità, termini offensivi, espressioni diffamatorie, espressioni razziste, sessiste, omofobiche o violente. Non vengono pubblicati gli indirizzi web inseriti a scopo promozionale. Invitiamo inoltre i lettori a firmare i propri commenti con nome e cognome.

Powered by WordPress & Theme by Anders Norén