di Michele Silletti @MicheleSilletti
Un vento nuovo sta soffiando anche nel mondo, apparentemente
freddo e sterile, dei dati. Probabilmente non è percepibile in maniera molto
evidente, è un mondo di ricercatori,
studiosi solitari, visionari un po' folli, il mondo di chi cerca
significati nei numeri, cerca relazioni, studia, simula, testa. Di chi ambisce,
addirittura, a predire il futuro. E' il mondo dei numeri, della misurazione dei fenomeni, come introducevo qualche settimana fa con il mio post numbers. La Statistica, un mondo strano.
Ma il vento sta cambiando. Dapprima sono iniziati a girare
dei nomi sempre più intriganti: data miner, data scientist. Un’aureola di magia
attribuita, però, sempre al singolo, allo studioso solitario, al visionario un po' folle. Ma anche questo confine, questo limite
della condanna alla solitudine, sta lentamente crollando. Oggi si parla di società,
organizzazioni, pubbliche amministrazioni “data-driven”.
Finalmente. L’analisi scientifica del
dato come strumento strategico per il supporto decisionale.
Allora, da statistico, direi di uscire da questa riserva, dalle finte
aspettative, o illusioni come quella di qualche decennio fa (“ogni Ente dovrà avere un ufficio statistica retto da un
laureato in Statistica”), una strana visione, o previsione, che mirava a
rinchiuderci ancor di più nelle nostre riserve. Sembrava che ci volessero “rinchiudere”
in un ufficio statistica, tutto per noi, ben separato da tutto il resto. Così non è stato, per fortuna, e l’analisi dei dati è
entrata dappertutto, in ogni settore, in ogni processo aziendale: ricerche di
mercato, misurazione dei risultati e del gradimento, mondo bancario, assicurativo, information technology, gestione banche dati, pubblica
amministrazione. Ovunque.
![]() |
Infografica Istat |
L’importanza della statistica (e degli Istituti nazionali di Statistica, così come di ogni Ufficio Statistica, pubblico o privato che sia) è ormai percepita in maniera diffusa. Le banche dati, le analisi, le rilevazioni, le previsioni rivestono oggi un’importanza notevole nella vita di uno stato moderno.
Per natura (spirito di archiviazione, conservazione e confronto dei dati nel tempo) noi statistici non potremo abbandonare mai i nostri “censimenti”, i nostri “panieri”, i nostri “indici”. Ma, come detto, arriva un vento nuovo. Accanto alla scienza (statistica) tradizionale, rigorosa, ufficiale, la velocità di trasformazione del mondo intero non poteva suscitare indifferenza, anzi. Siamo travolti, letteralmente sommersi dai dati, generati e gestiti in quantità e con velocità ormai indefinibili. Per questo la statistica non poteva rimanere ferma essendo, per definizione, sperimentale.
Facciamo qualche esempio riportando, dal sito istituzionale dell'Istat, alcuni primi esempi pratici: “in linea con il percorso intrapreso da Eurostat e da altri istituti di
statistica, l’Istat sperimenta l’utilizzo di nuove fonti e l’applicazione di
metodi innovativi nella produzione di dati”. Parliamo di statistiche sperimentali: metodi,
probabilmente, non pienamente (o non ancora) rispondenti ai rigorosi criteri
scientifici ma essenziali nella “società dell’informazione” basata sul dato e sul suo tempestivo utilizzo.
Metodi dal potenziale elevatissimo, “perché
colmano lacune conoscitive in maniera tempestiva; perché danno impulso allo
sviluppo di nuove analisi e nuovi indicatori; perché garantiscono un valido
sostegno conoscitivo alle policy”.
Ci avviciniamo sempre di più, quindi, al sogno di una
società “data-driven” e, più nello specifico, di una Pubblica Amministrazione
fondata sul proprio patrimonio informativo. Da qualche mese il nostro Istituto
Nazionale di Statistica ha iniziato a pubblicare quattro differenti tipologie
di statistiche sperimentali (riporto, sempre dal sito istituzionale Istat):
- Classificazioni non standard ottenute a partire dalle tassonomie ufficiali utilizzate correntemente dall’Istat, oppure proposte sperimentalmente nell’ambito di attività di analisi e ricerca attraverso elaborazioni condotte su microdati.
- Nuovi indicatori prodotti sulla base dell’integrazione di una pluralità di fonti, ufficiali e non ufficiali, l’enfasi è posta sui fenomeni allo studio e non sulle fonti statistiche intese a descriverli
- Analisi e quadri interpretativi di fenomeni complessi ottenuti attraverso l’integrazione di fonti ufficiali.
- Risultati di Sperimentazioni su Big Data, caratterizzate per loro natura dall’utilizzo di fonti non ufficiali.
Soprattutto quest’ultima è quella che stuzzica maggiormente
la fantasia per le potenzialità che si intravedono nonostante, per definizione,
si caratterizzino per l’utilizzo di fonti non ufficiali; ad esempio la
tradizionale misurazione del tasso di inflazione inizia ad essere affiancata, e
magari un giorno sarà sostituita, da fonti provenienti da Big Data: con i data
scanner collegati alle casse dei supermercati di 16 grandi gruppi della
distribuzione nel commercio di alimenti e beni per la casa copriamo oltre il
90% degli acquisti totali (fatturato della grande distribuzione) con una
misurazione praticamente continua e vicina al c.d. “universo statistico di
riferimento”.
Questo che segue, invece, è il Food Price Monitoring Tool diEurostat che misura l’evoluzione del prezzo nella catena di distribuzione, dalla
produzione alla vendita al dettaglio, passando per la trasformazione.
Un'altra sperimentazione, preziosissima, deriva dall’utilizzo
dei dati di telefonia mobile per tracciare (in maniera anonima!) gli
spostamenti fisici delle persone nel territorio, basandosi su Open Street Map e
fornendo informazioni importanti e tempestive sulla mobilità. Saranno
utilizzati, ad esempio, per la programmazione o la gestione delle
infrastrutture dei servizi di trasporto, per la misurazione del rischio di
incidenti stradali e l’adozione di relative misure di prevenzione.
Parliamo poi dello studio sulle informazioni derivanti dalle
ricerche di lavoro come supporto ai soggetti, istituzionali e non, che si
occupano di incontro della domanda e offerta oppure, anche in questo caso, per
la programmazione dei percorsi formativi o per migliorare, ad esempio, la
misurazione del tasso di disoccupazione.
Ma potremmo andare avanti con altre analisi di fenomeni come il “SOCIAL MOOD ON ECONOMY
INDEX” che misura il sentiment italiano sull’economia basata sui dati di
Twitter o l’analisi dell’“UTILIZZO DEI SITI WEB DA PARTE DELLE IMPRESE” che si
basa su tecniche di web scraping e di natural language processing (questa è
Intelligenza Artificiale!).
L’estasi di uno statistico, il sogno di una società guidata
dall’informazione e dalla conoscenza dei fenomeni, lo strumento unico per
combattere quello strano meccanismo, o degenerazione, che l’eccesso di
informazione stessa ha, probabilmente, creato: quella apparente necessità di esprimere pareri e pubblicare valutazioni a prescindere dai fatti, a prescindere dalle competenze e
conoscenze.
La tecnologia e la rete oggi hanno superato tutti i limiti
che fino a qualche anno fa impedivano la conoscenza e consapevolezza diffusa
dei fenomeni, la loro misurazione, il loro aggiornamento. L’auspicio, in quanto
essere umano più che statistico, è che le scelte diventino sempre più collegate
alla conoscenza reale, empirica. Che una società e quindi una PA “data-driven”
utilizzi nel modo giusto, con le professionalità giuste, le fonti informative
come supporto decisionale e operativo. Credo che questo sarebbe un ingrediente fondamentale per una società migliore e consapevole.
Commenti
Posta un commento