Comunitario e Internazionale

Machine learning, qualità della raccolta decisiva per gli atti basati sui dati

di Amedeo Santosuosso

L’analisi dei big data utilizza metodi e strumenti di machine learning, che rendono possibile esaminare grandi quantità di dati. Anche il diritto è coinvolto.

Alcuni chiarimenti possono essere utili:
il «processo decisionale basato su dati» (data-driven decision making) “non” è sinonimo di «decisione basata su prove», (evidence based), ma è un modo diverso di ragionare e decidere;
il «processo decisionale basato su regole» (rule-based decisionmaking) “non” è sinonimo di «decisione presa in modo giuridico», poiché il processo decisionale basato su regole, nel suo senso più rigoroso, è il modo di decidere secondo una regola scritta e chiaramente definita.
Un tribunale che prende una decisione secondo il criterio del «miglior interesse» del bambino o del paziente, o secondo il sistema di equità o determina l’entità di una condanna penale, prende decisioni che non possono dirsi basate su regole, a causa della natura e della qualità intrinseca della norma che è stato applicata, non chiaramente definita e che lascia margini di definizione a opera proprio del giudice;
un sistema di decisione basato su dati è un sistema in cui la decisione viene presa in base a ciò che emerge dall’applicazione degli algoritmi di apprendimento automatico.
È importante la distinzione tra impostare «un problema in avanti e un problema inverso», dove l’approccio dal modello ai dati osservabili è quello usato tradizionalmente in ambiti sperimentali, mentre «l’approccio inverso è il cuore dell’apprendimento automatico», dove «si usano i dati osservabili per costruire il modello piuttosto che usare il modello per assegnare peso causale ai dati osservabili».
Il rapporto ipotesi-test, alla base del metodo scientifico moderno, è invertito ed è l’analisi con tecnologie machine learning di un appropriato insieme di dati a far emergere un possibile modello da poi testare;
la questione della natura e dell’interpretazione dei risultati prodotti con l’uso di algoritmi è cruciale. Seguendo Kevin Ashley (2017), poiché un algoritmo di machine learning impara regole basate su regolarità statistiche, le sue regole potrebbero non sembrare ragionevoli per gli stessi umani.
A volte i dati contengono caratteristiche che, per motivi spuri, come la coincidenza o la selezione parziale, sono associati ai risultati dei casi in una particolare raccolta. Sebbene le regole indotte dalla macchina possano portare a previsioni accurate, esse non si riferiscono all’esperienza umana e potrebbero non essere così comprensibili per l’uomo come le regole costruite da un esperto.

I tipici problemi delle decisioni basate sui dati sono la qualità dei dati raccolti e i modi delle loro analisi e interpretazione, tanto che qualsiasi errore e/o pregiudizio in uno dei passaggi può influire pesantemente sulla decisione.

Il problema dei sistemi decisionali basati su regole è che basarsi su regole significa che determinate regole sono state seguite, indipendentemente dalla qualità e/o dall’efficienza della decisione presa. I due sistemi possono non essere agevolmente combinabili in termini teorici, ma già coesistono.

Si pensi alle valutazioni che consulenti tecnici e periti offrono ai giudici sulla base dei dati disponibili, adottando anche tecniche big data, e si pensi al tasso di non spiegabilità che hanno le decisioni legali, ma non rule-based.

Per saperne di piùRiproduzione riservata ©