Passa ai contenuti principali

Data-driven


di Michele Silletti @MicheleSilletti


Un vento nuovo sta soffiando anche nel mondo, apparentemente freddo e sterile, dei dati. Probabilmente non è percepibile in maniera molto evidente, è un mondo di ricercatori, studiosi solitari, visionari un po' folli, il mondo di chi cerca significati nei numeri, cerca relazioni, studia, simula, testa. Di chi ambisce, addirittura, a predire il futuro. E' il mondo dei numeri, della misurazione dei fenomeni, come introducevo qualche settimana fa con il mio post numbers. La Statistica, un mondo strano.

Ma il vento sta cambiando. Dapprima sono iniziati a girare dei nomi sempre più intriganti: data miner, data scientist. Un’aureola di magia attribuita, però, sempre al singolo, allo studioso solitario, al visionario un po' folle. Ma anche questo confine, questo limite della condanna alla solitudine, sta lentamente crollando. Oggi si parla di società, organizzazioni, pubbliche amministrazioni “data-driven”.  Finalmente. L’analisi scientifica del dato come strumento strategico per il supporto decisionale.

Allora, da statistico, direi di uscire da questa riserva, dalle finte aspettative, o illusioni come quella di qualche decennio fa (“ogni Ente dovrà avere un ufficio statistica retto da un laureato in Statistica”), una strana visione, o previsione, che mirava a rinchiuderci ancor di più nelle nostre riserve. Sembrava che ci volessero “rinchiudere” in un ufficio statistica, tutto per noi, ben separato da tutto il resto. Così non è stato, per fortuna, e l’analisi dei dati è entrata dappertutto, in ogni settore, in ogni processo aziendale: ricerche di mercato, misurazione dei risultati e del gradimento, mondo bancario, assicurativo, information technology, gestione banche dati, pubblica amministrazione. Ovunque.

Infografica Istat

L’importanza della statistica (e degli Istituti nazionali di Statistica, così come di ogni Ufficio Statistica, pubblico o privato che sia) è ormai percepita in maniera diffusa. Le banche dati, le analisi, le rilevazioni, le previsioni rivestono oggi un’importanza notevole nella vita di uno stato moderno. 

Per natura (spirito di archiviazione, conservazione e confronto dei dati nel tempo) noi statistici non potremo abbandonare mai i nostri “censimenti”, i nostri “panieri”, i nostri “indici”. Ma, come detto, arriva un vento nuovo. Accanto alla scienza (statistica) tradizionale, rigorosa, ufficiale, la velocità di trasformazione del mondo intero non poteva suscitare indifferenza, anzi. Siamo travolti, letteralmente sommersi dai dati, generati e gestiti in quantità e con velocità ormai indefinibili. Per questo la statistica non poteva rimanere ferma essendo, per definizione, sperimentale.

Facciamo qualche esempio riportando, dal sito istituzionale dell'Istat, alcuni primi esempi pratici: “in linea con il percorso intrapreso da Eurostat e da altri istituti di statistica, l’Istat sperimenta l’utilizzo di nuove fonti e l’applicazione di metodi innovativi nella produzione di dati”. Parliamo di statistiche sperimentali: metodi, probabilmente, non pienamente (o non ancora) rispondenti ai rigorosi criteri scientifici ma essenziali nella “società dell’informazione” basata sul dato e sul suo tempestivo utilizzo. Metodi dal potenziale elevatissimo, “perché colmano lacune conoscitive in maniera tempestiva; perché danno impulso allo sviluppo di nuove analisi e nuovi indicatori; perché garantiscono un valido sostegno conoscitivo alle policy”.

Ci avviciniamo sempre di più, quindi, al sogno di una società “data-driven” e, più nello specifico, di una Pubblica Amministrazione fondata sul proprio patrimonio informativo. Da qualche mese il nostro Istituto Nazionale di Statistica ha iniziato a pubblicare quattro differenti tipologie di statistiche sperimentali (riporto, sempre dal sito istituzionale Istat):
  • Classificazioni non standard ottenute a partire dalle tassonomie ufficiali utilizzate correntemente dall’Istat, oppure proposte sperimentalmente nell’ambito di attività di analisi e ricerca attraverso elaborazioni condotte su microdati.
  • Nuovi indicatori prodotti sulla base dell’integrazione di una pluralità di fonti, ufficiali e non ufficiali, l’enfasi è posta sui fenomeni allo studio e non sulle fonti statistiche intese a descriverli
  • Analisi e quadri interpretativi di fenomeni complessi ottenuti attraverso l’integrazione di fonti ufficiali.
  • Risultati di Sperimentazioni su Big Data, caratterizzate per loro natura dall’utilizzo di fonti non ufficiali.
Soprattutto quest’ultima è quella che stuzzica maggiormente la fantasia per le potenzialità che si intravedono nonostante, per definizione, si caratterizzino per l’utilizzo di fonti non ufficiali; ad esempio la tradizionale misurazione del tasso di inflazione inizia ad essere affiancata, e magari un giorno sarà sostituita, da fonti provenienti da Big Data: con i data scanner collegati alle casse dei supermercati di 16 grandi gruppi della distribuzione nel commercio di alimenti e beni per la casa copriamo oltre il 90% degli acquisti totali (fatturato della grande distribuzione) con una misurazione praticamente continua e vicina al c.d. “universo statistico di riferimento”.

Questo che segue, invece, è il Food Price Monitoring Tool diEurostat che misura l’evoluzione del prezzo nella catena di distribuzione, dalla produzione alla vendita al dettaglio, passando per la trasformazione.

 
Food Price Monitoring Tool

Un'altra sperimentazione, preziosissima, deriva dall’utilizzo dei dati di telefonia mobile per tracciare (in maniera anonima!) gli spostamenti fisici delle persone nel territorio, basandosi su Open Street Map e fornendo informazioni importanti e tempestive sulla mobilità. Saranno utilizzati, ad esempio, per la programmazione o la gestione delle infrastrutture dei servizi di trasporto, per la misurazione del rischio di incidenti stradali e l’adozione di relative misure di prevenzione.
Parliamo poi dello studio sulle informazioni derivanti dalle ricerche di lavoro come supporto ai soggetti, istituzionali e non, che si occupano di incontro della domanda e offerta oppure, anche in questo caso, per la programmazione dei percorsi formativi o per migliorare, ad esempio, la misurazione del tasso di disoccupazione.
Ma potremmo andare avanti con altre analisi di fenomeni come il “SOCIAL MOOD ON ECONOMY INDEX” che misura il sentiment italiano sull’economia basata sui dati di Twitter o l’analisi dell’“UTILIZZO DEI SITI WEB DA PARTE DELLE IMPRESE” che si basa su tecniche di web scraping e di natural language processing (questa è Intelligenza Artificiale!).

L’estasi di uno statistico, il sogno di una società guidata dall’informazione e dalla conoscenza dei fenomeni, lo strumento unico per combattere quello strano meccanismo, o degenerazione, che l’eccesso di informazione stessa ha, probabilmente, creato: quella apparente necessità di esprimere pareri e pubblicare valutazioni a prescindere dai fatti, a prescindere dalle competenze e conoscenze.
La tecnologia e la rete oggi hanno superato tutti i limiti che fino a qualche anno fa impedivano la conoscenza e consapevolezza diffusa dei fenomeni, la loro misurazione, il loro aggiornamento. L’auspicio, in quanto essere umano più che statistico, è che le scelte diventino sempre più collegate alla conoscenza reale, empirica. Che una società e quindi una PA “data-driven” utilizzi nel modo giusto, con le professionalità giuste, le fonti informative come supporto decisionale e operativo. Credo che questo sarebbe un ingrediente fondamentale per una società migliore e consapevole.

Commenti

Post popolari in questo blog

Il futuro non aspettò. Riflessioni sullo smart working

di Michele Silletti ( @MicheleSilletti ) Quando si è nel mezzo di una tempesta, gli ottimisti cercano con lo sguardo la via d’uscita, gli altri si aggrappano per non essere spazzati via, magari anche guardandosi indietro, rimpiangendo la calma precedente. Nel pieno del “lockdown” lo sguardo è ovviamente già sul dopo, su quello che l’emergenza Covid-19 avrà lasciato, sul come ripartire, sul cosa prendere di buono da questa esperienza vissuta. L’emergenza ha avuto un impatto inevitabile sulla vita quotidiana, spazzando via certezze e abitudini, costringendoci a modificare, nostro malgrado, stile di vita e quindi di lavoro. In pochi giorni nazioni intere si sono dovute organizzare per svolgere le proprie attività in una modalità diversa. E’ inutile parlare di lavoro agile o smart working (o di smart schooling) e di arrotolarsi sulla definizione più corretta, forse, di telelavoro forzato; sembrerebbe un esercizio di stile su una situazione che tutti, auspichiamo, duri il minor te

I numeri sono importanti!

di Michele Silletti ( @MicheleSilletti ) Una trentina di anni fa questa affermazione, riferita alle "parole", ha lasciato un segno importante nella cinematografia italiana e nel modo di parlare; un invito a porre attenzione e utilizzare adeguatamente la ricchezza della nostra lingua. Da statistico, appassionato di ricerca e analisi ho voluto riutilizzarne il significato. Forest of numbers di Emmanuelle Moureaux (fonte: https://www.domusweb.it/it/notizie/2017/02/09/forest_of_numbers.html) Evito di partire dagli inizi e quindi non dirò, di certo " Il calcolo accurato è la porta d'accesso alla conoscenza di tutte le cose e agli oscuri misteri"  [il papiro di Rhind],   ma la sostanza è quella.  Vivendo l'era di internet, dell'accesso a infinite fonti informative, il faro va acceso sulla qualità e attendibilità delle fonti. Da alcuni anni si è sviluppato un acceso dibattito "social" (ma non solo) sulle fake-news; certo, parliamo di co

Appunti sul tempo

di Francesca Sanesi Qualche anno fa discutevo con un amico del senso del tempo. Siccome ho una formazione classica, ho l’insopportabile abitudine di citare e in quell’occasione rispolverai niente meno che Bachtin (nonostante parlassimo di politica e non ricordo, dunque, il perché di questo azzardato accostamento), recuperando alcune considerazioni sul cronotopo in letteratura da “Estetica e Romanzo”. Diceva Bachtin: “ Tutta l’azione del romanzo greco, quindi, tutti gli avvenimenti e tutte le avventure che lo riempiono non rientrano nella serie temporale storica, né in quella quotidiana, né in quella biografica, né in quella dell’età biologica elementare. (…) In questo tempo nulla muta: il mondo resta così com’era, biograficamente neppure la vita dei protagonisti muta, i loro sentimenti restano anch’essi immutati, e le persone in tale tempo non invecchiano neppure. Questo tempo vuoto non lascia alcuna traccia, alcun connotato duraturo del proprio fluire. È (…) uno iato extra