Passa ai contenuti principali

Nesso di causalità


di Michele Silletti (@MicheleSilletti)

Ho rincorso vanamente la possibilità di raccogliere con la logica tutti i punti, gli articoli, i titoli, gli argomenti che quotidianamente evidenziamo, per lavoro ma non solo, direi per “vita” o per modo d’essere. Ma l’avevamo detto in apertura di questo nostro blog che ci poniamo sempre più domande rispetto alle risposte che otterremo. 
Parlerò della “mia” scienza, la statistica, come strumento delle altre scienze, delle evoluzioni che sta attraversando e dei collegamenti alla vita e agli oggetti di ogni giorno. Scienza strumento di altre scienze, quindi. Ciascuna con storie che nascono con l’uomo stesso, distinte ma collegate, a volte dipendenti o addirittura derivate. Ad inizio del secolo scorso, nel grembo dei Circoli di Vienna e di Berlino, nacque addirittura una filosofia della scienza con l’empirismo logico, in un momento in cui la relatività e la meccanica dei quanti avevano messo in crisi una funzione che all’uomo è sempre appartenuta: la ricerca del nesso di causalità.
La statistica, e la scienza in generale, non può essere solo descrizione e previsione di un fenomeno. Senza spiegazione, ricerca della causa, assume un ruolo di appendice poco utile. Il sapere scientifico non può prescindere dal considerare queste componenti in un unico insieme che forma ogni legge e teoria.
Nel tempo la spiegazione scientifica ha gradualmente abbandonato dogmi e leggi consolidate o ereditate invertendo, soprattutto, l’approccio logico della sua generazione in un percorso che va dal basso verso l’alto: partire da una constatazione, da una situazione effettiva, per spiegare il fenomeno e individuare la causa. 

Queste considerazioni storiche spalancano le porte sul nostro prossimo futuro e sui nostri prodotti: macchine, robot, algoritmi che ci affiancano e sostituiscono nella vita di tutti i giorni. Ma se l’uomo non è mai riuscito a completare la sua “ricerca delle verità”, ci riuscirà con i suoi assistenti o, addirittura, questi diventeranno le mitologiche macchine della verità?
Le mie considerazioni, ovviamente, non mirano a tanto ma a collegare questa evoluzione con quegli argomenti più terreni che quotidianamente ci invadono: semplificazione, intelligenza artificiale ed etica.

La statistica è una scienza strumentale utilizzata in tantissimi ambiti ma, bisogna dirlo, al pari di altre scienze, ha subito una sorta di limite storico (e forse, anche, tecnologico) concentrandosi esclusivamente su misurazione e capacità previsionali della stessa. Quasi ogni risultato statistico si concretizza in affermazioni di “correlazione” o “associazione” tra variabili e fenomeni; misure molto utili, utilizzatissime in diverse scienze (medicina, psicologia, fisica, ecc.) distinte però, scientificamente, dalle cause. Questo approccio è utile come percorso parziale di studio di un fenomeno che deve completarsi, però, con la ricerca delle cause. Oggi, spesso, la disinformazione, le fake-news, si basano su conclusioni e affermazioni che partono da una analisi di correlazioni più o meno rigorose. Potremmo usare la metafora del canto del gallo all’alba. Il canto mattutino del gallo è correlato fortemente al sorgere del sole ma potremmo mai giungere alla conclusione che ne sia la causa? 

Il metodo scientifico di ricerca delle cause dei fenomeni è una rivoluzione nelle finalità delle scienze applicate, Judea Pearl nel suo “libro dei perché” (The book of why) parla di causal revolution.  



Rivoluzione è una parola così inflazionata, spesso usata a sproposito per quella spasmodica ricerca di (o illusione di vivere) cambiamenti epocali. Non so se questo lo sia. Ma di certo nella “ricerca scientifica delle verità” c’è quella sensazione di essere in un momento storico di passaggio epocale, la forte percezione di iniziare ad avere a disposizione tutti gli strumenti per un cambiamento, una rivoluzione. Conoscenza, dati, capacità di calcolo. Secondo Judea Pearl questa rivoluzione può diventare di massa solo se entra nella nostra vita quotidiana, mantenendo però alcuni principi fondamentali: 


  • basarsi sull’applicazione di metodi scientifici ma essere illustrata e diffusa in termini comuni, alla portata di tutti
  • consentire una condivisione delle tesi scientifiche
  • collocarsi nel grembo dell’Intelligenza Artificiale


Oggi, quindi, approfondire questi principi è fondamentale perché siamo nel momento in cui i “robot intelligenti” vengono pensati, progettati e quindi il compito fondamentale dell’uomo diventa, adesso, quello di progettarli per non commettere quegli errori, bias, che spesso l’uomo stesso ha commesso. E’ effettivamente ed essenzialmente una questione etica. Macchine, algoritmi di questa generazione arriveranno a spiegarci i motivi delle cose, dei fenomeni. Potranno addirittura insegnarci qualcosa, aiutarci a capire e spiegarci perché le nostre menti giungono a determinate conclusioni, anche quelle sbagliate, ovviamente. 
Può essere ben immaginabile, quindi, l’importanza dell’etica della macchina e del consolidare questo principio di pensiero razionale e della causa-effetto. Scienza, oggi, significa creare nuovi medicinali e misurare la relativa efficacia come cura, studiare una politica economica e constatare i relativi effetti sulla vita sociale o economica, ricercare e misurare i fattori naturali e artificiali che influenzano le evoluzioni climatiche. Con un approccio scientifico statistico questa scienza può essere individuata come “causal inference”: è un approccio che, nonostante tutto, mette la mente umana al di sopra di qualunque altro fattore utile nello sviluppo del processo scientifico. Ipotizzare gli effetti di una scelta, sulla base dello studio di quello che si conosce, che è già successo, è un approccio che può modificare l’evoluzione delle cose.
L’uomo è l’unica specie che ha adottato questo approccio, lo fa da decine di migliaia di anni e ciò lo ha portato a realizzare e vivere questa era tecnologica: questo avviene perché si è sempre fatto una domanda: “perché?”. Il cervello umano è tuttora, infatti, lo strumento più avanzato per l’analisi “causa-effetto”.

Il rapporto causa effetto che ha ispirato filosofi che vanno da Platone a Immanuel Kant, dal punto di vista statistico-scientifico si è tradotto, inizialmente, in uno stato d'animo soggettivo di attesa per cui al ripetersi di un determinato effetto si riteneva, senza alcuna assoluta certezza, che se ne dovesse verificare un altro simile. La scienza moderna, invece, ha ricondotto queste analisi su di un “sistema causale” e non sulla vana ricerca dell’unica causa-effetto.

Riusciremo, quindi, a creare anche uno “scienziato artificiale”? Quello che già oggi possiamo dire è che abbiamo la possibilità di utilizzare metodi matematici sempre più raffinati per mettere a fattor comune conoscenze e dati e dare risposte sempre più attendibili, vicine al concetto di “verità”: oggi è più facile individuare la causa dell’incremento delle vendite tra, ad esempio, una nuova politica di prezzi o la promozione; oggi è possibile valutare l’efficacia di un trattamento farmacologico nella cura di una malattia, e così via.

Cosa sta succedendo di diverso rispetto a quanto accaduto nelle comunità scientifiche in tutto il secolo scorso? Si cerca, continuamente, di raccontare in modo adeguato l’alba dell’era dell’AI  e delle infinite possibilità dei Big Data e del Deep Learning. Forse si sta cercando di non commettere quell’errore storico (probabilmente fisiologico) che è stata una delle cause dei fallimenti di tanti studi e studiosi: non essere stati in grado di comunicare la portata, l’importanza del loro studio, della loro ricerca. Oggi parleremmo in termini di “capacità di attrarre finanziamenti” o, semplicemente, consenso.
Questa è un’altra relazione di “causa-effetto” sulla quale bisognerebbe indagare ma forse, al momento, è sufficiente limitarci a dire che è fondamentale comunicare, con un linguaggio accessibile ad una massa che oggi è mediamente più pronta e competente per percepire la portata e l’importanza di una evoluzione tecnologica del genere. E’ fondamentale rendere e mantenere il terreno fertile alla scienza. In pochissimi saprebbero descrivere scientificamente il motivo per cui spingendo un interruttore accadono determinati risultati o come facciamo a fare le migliaia di cose che facciamo con uno smartphone, eppure nessuno ne potrebbe fare a meno e, infatti, chiunque è disposto a spendere cifre rilevanti pur di aver a disposizione i più fantastici ritrovati tecnologici.

E’ vero che la scienza, oggi, si muove molto su input del mercato, ma questo avviene ormai da qualche secolo: la teoria della probabilità si è sviluppata per misurare la correttezza o l’equità dei giochi di carte, la statistiche demografiche si sono sviluppate per consentire alle compagnie di assicurazione di avere strumenti di valutazione dei premi assicurativi misurando aspettativa di vita o altri rischi.

Così come, storicamente, nella statistica si è pensato che le risposte fossero nei dati stessi, svelate da “fantastici” sistemi di data-mining (che, invece, continuavano a calcolare indici, percentuali, correlazioni, ecc.), non va commesso lo stesso errore con i più attuali “big data”, con la data science e con miracolosi mestieri come il “data scientist”. Non sono i dati la ricchezza.
Per avvalorare la sua tesi, che condivido pienamente, Judea Pearl sostiene la necessita di integrare i dati in un “sistema di calcolo delle cause” con la conoscenza (ciò che sappiamo) e gli obiettivi (ciò che vogliamo sapere).  Il suo Causal Diagram è, appunto, un Sistema di Cause dotato di una integrazione quanti-qualitativa. Non va trascurata, infatti, la componente qualitativa che mira a studiare il processo che genera i dati. Non serve solo osservare ma bisogna essere consapevoli della realtà e dei fattori esterni in cui cause ed effetti condizionano enormemente le considerazioni, scelte, idee del ricercatore stesso. 
A cosa porta la causal revolution? Anticipare gli effetti di una azione senza attuarla effettivamente, ossia strumenti di simulazione sempre più efficaci. Questa metodologia di ragionamento causale viene chiamato anche approccio controfattuale: l’inferenza causale utilizza dati e conoscenze per arrivare a rispondere ad una domanda, al motivo, alla causa di un fenomeno, non solo alla rappresentazione numerica del fenomeno. Un algoritmizzazione della controfattualità in grado di rispondere alla domanda “Cosa succede se” basandosi sì sull’analisi delle azioni passate ma integrandole, acquisendo, visioni e scenari alternativi. E’ un metodo che “umanizza” l’approccio del pensiero robotizzato donandogli una componente, appunto, tipicamente umana.
Questi modelli beneficiano, pertanto, di un requisito sconosciuto al data mining o deep learning: l’adattabilità.

Ultima raccomandazione fondamentale dello studioso ed ulteriore macigno sulle convinzioni classiche della statistica: raccogliere i dati solo dopo aver disegnato il modello causale e le queries scientifiche a cui vorremmo rispondere (questo per evitare che il lavoro di progettazione del modello sia influenzato dai dati stessi, dai primi risultati visti o intravisti, da atteggiamenti, esperienze o opinioni del ricercatore).

Per questo l’atteggiamento e l’approccio di far affidamento unicamente sui dati come strumento cognitivo e non su un modello integrato, causale, è rischioso, sbagliato. Non sono i dati a darci le risposte. 

E’ evidente, quindi, come anche noi umani dobbiamo usare la scienza per migliorare i nostri processi cognitivi.

Commenti

Post popolari in questo blog

Il futuro non aspettò. Riflessioni sullo smart working

di Michele Silletti ( @MicheleSilletti ) Quando si è nel mezzo di una tempesta, gli ottimisti cercano con lo sguardo la via d’uscita, gli altri si aggrappano per non essere spazzati via, magari anche guardandosi indietro, rimpiangendo la calma precedente. Nel pieno del “lockdown” lo sguardo è ovviamente già sul dopo, su quello che l’emergenza Covid-19 avrà lasciato, sul come ripartire, sul cosa prendere di buono da questa esperienza vissuta. L’emergenza ha avuto un impatto inevitabile sulla vita quotidiana, spazzando via certezze e abitudini, costringendoci a modificare, nostro malgrado, stile di vita e quindi di lavoro. In pochi giorni nazioni intere si sono dovute organizzare per svolgere le proprie attività in una modalità diversa. E’ inutile parlare di lavoro agile o smart working (o di smart schooling) e di arrotolarsi sulla definizione più corretta, forse, di telelavoro forzato; sembrerebbe un esercizio di stile su una situazione che tutti, auspichiamo, duri il minor te

I numeri sono importanti!

di Michele Silletti ( @MicheleSilletti ) Una trentina di anni fa questa affermazione, riferita alle "parole", ha lasciato un segno importante nella cinematografia italiana e nel modo di parlare; un invito a porre attenzione e utilizzare adeguatamente la ricchezza della nostra lingua. Da statistico, appassionato di ricerca e analisi ho voluto riutilizzarne il significato. Forest of numbers di Emmanuelle Moureaux (fonte: https://www.domusweb.it/it/notizie/2017/02/09/forest_of_numbers.html) Evito di partire dagli inizi e quindi non dirò, di certo " Il calcolo accurato è la porta d'accesso alla conoscenza di tutte le cose e agli oscuri misteri"  [il papiro di Rhind],   ma la sostanza è quella.  Vivendo l'era di internet, dell'accesso a infinite fonti informative, il faro va acceso sulla qualità e attendibilità delle fonti. Da alcuni anni si è sviluppato un acceso dibattito "social" (ma non solo) sulle fake-news; certo, parliamo di co

Appunti sul tempo

di Francesca Sanesi Qualche anno fa discutevo con un amico del senso del tempo. Siccome ho una formazione classica, ho l’insopportabile abitudine di citare e in quell’occasione rispolverai niente meno che Bachtin (nonostante parlassimo di politica e non ricordo, dunque, il perché di questo azzardato accostamento), recuperando alcune considerazioni sul cronotopo in letteratura da “Estetica e Romanzo”. Diceva Bachtin: “ Tutta l’azione del romanzo greco, quindi, tutti gli avvenimenti e tutte le avventure che lo riempiono non rientrano nella serie temporale storica, né in quella quotidiana, né in quella biografica, né in quella dell’età biologica elementare. (…) In questo tempo nulla muta: il mondo resta così com’era, biograficamente neppure la vita dei protagonisti muta, i loro sentimenti restano anch’essi immutati, e le persone in tale tempo non invecchiano neppure. Questo tempo vuoto non lascia alcuna traccia, alcun connotato duraturo del proprio fluire. È (…) uno iato extra