Giustizia Predittiva e Costituzione: rischi, algoritmi e limiti dell’IA nei processi

1.FONDAMENTI GIURIDICI DELLA GIUSTIZIA PREDITTIVA

Con il termine “giustizia predittiva”, stiamo ad indicare l’uso di algoritmi e dell’intelligenza artificiale al fine di prevedere i risultati legali. Questa, è collocata in una posizione mediana tra la tecnologia e la giurisprudenza.

Il compito che svolge è quello di analizzare enormi quantità di dati, che hanno origine da precedenti decisioni giudiziarie, al fine di identificare probabili modelli e tendenze che in futuro potranno influenzare l’esito.

Scopo della giustizia predittiva è quello di assicurare l’efficienza e la prevedibilità dei processi legali. Per i professionisti del diritto, tra cui gli avvocati, l’accesso a tali strumenti, può portare ad una preparazione efficiente dei casi e una conseguente strategia di difesa o di accusa ottimale.

L’integrazione della giustizia predittiva nel sistema giudiziario dovrà assicurare un bilanciamento appropriato tra i vantaggi della tecnologia e la tutela dei diritti fondamentali degli individui.

Un ruolo fondamentale all’interno della giustizia predittiva è ricoperto dall’intelligenza artificiale, che consente di elaborare e analizzare enormi testi giuridici, al fine di estrarre dati utilizzabili.

Un legame inestricabile è anche quello con i Big Data, grandi insiemi di dati giudiziari che costituiscono la materia essenziale per fare delle previsioni. Sarà proprio lo studio di questi dati, a consentire l’individuazione dei modelli che vengono utilizzati per anticipare giudizi futuri.

Per quanto riguarda i dati elaborati dai sistemi di giustizia predittiva, l’input è rappresentato dalla base informativa, costituita da norme e pronunce giurisprudenziale, mentre l’output è dato dall’anticipazione del procedimento decisionale. Obiettivo dei database è quello di unire l’analisi del comportamento del giudice, affidato all’operatore a quello della macchina.

2.I LIMITI COSTITUZIONALI DELLA GIUSTIZIA PREDITTIVA

Con l’introduzione di strumenti predittivi, il processo penale essendo costruito da principi non derogabili, tra cui il principio della personalità di responsabilità penale (art. 27 Cost.), il principio di presunzione di innocenza (art.27, comma 2), il principio di libertà personale (art.13) e il principio di giusto processo (art.111) si rischia di compromettere la soggettività del giudizio, la valutazione individualizzata delle prove e il principio di legalità della pena.

Inoltre, l’opacità degli algoritmi può ostacolare il diritto di difesa, garantito dall’articolo 24 della Costituzione, diritto inviolabile che deve essere assicurato a tutti i cittadini, andando ad impedire all’imputato di comprendere e contestare le basi logiche di una decisione assistita.

La giurisprudenza italiana ha assunto una posizione di chiusura prudente. Alcuni Tribunali hanno escluso l’utilizzabilità di relazioni predittive in fase di cautela, evocando l’esigenza di fondare ogni decisione su elementi individuali e contestuali, non su analogie statistiche.

A livello europeo, la Commissione per l’Efficienza della Giustizia ha adottato delle linee guida sull’utilizzo dell’intelligenza artificiale nei procedimenti giudiziari, fissando dei requisiti fondamentali tra cui la trasparenza, l’equità e il controllo umano. Tale regolamento, approvato nel 2024, classifica l’utilizzo dell’intelligenza artificiale nel diritto penale tra gli impieghi ad alto rischio, andando a richiedere garanzie elevate.

La riforma Cartabia è intervenuta sui diversi livelli della struttura processuale, con lo scopo di fornire un nuovo assetto alla giustizia penale ispirato ai canoni di efficienza ed efficacia, avviando il processo alla transizione digitale. Nonostante, l’evidente intervento normativo, i meccanismi continuano a funzionare a fatica. Le direttive eurounitarie si dichiarano a favore di una catarsi digitale intesa come strumento di ottimizzazione del sistema di giustizia, ma tale obiettivo è stato raggiunto parzialmente. Tra gli obiettivi del PNRR, rientra quello di sfruttare al massimo le opportunità fornite dalle nuove tecnologie applicabili al mondo giudiziario, compresi i modelli della giustizia predittiva. Ci si riferisce ai tools di valutazione della pericolosità sociale e al rischio di recidiva del reo, che possono essere sfruttati dal giudice nel momento decisorio, da un lato per supportare il giudicante senza oltrepassare la discrezionalità e garantendone l’imparzialità, dall’altro, a contribuire all’abbattimento dei tempi della giustizia, assicurando delle decisioni prevedibili e la certezza del diritto.

Nonostante tutto, il legislatore ha avuto difficoltà nel regolamentare l’utilizzo nei diversi segmenti processuali.

3.PRIME APPLICAZIONI DI GIUSTIZIA PREDITTIVA IN ITALIA

Tra le prime applicazioni della giustizia predittiva, in ambito europeo, rientra il caso del sistema Predictive, creato in Francia nel 2016. Questo, consente di stimare l’ammontare del danno risarcibile, tenendo conto delle cause di carattere commerciale o riguardanti la proprietà intellettuale. In Italia, può essere menzionato il progetto della Corte d’appello di Brescia, che dal 2021, utilizza un sistema decisionale dotato di una banca dati ragionata e trasparente sul diritto del lavoro e delle imprese, costituito da tendenze giurisprudenziali, in grado di favorire la circolarità della giurisprudenza tra primo e secondo grado, mettendo, inoltre, in evidenza il tempo medio di decisione della causa.

Altro progetto da citare, è quello della Corte di Appello di Venezia, in collaborazione con l’Università Ca’ Foscari di Venezia, Unioncamere del Veneto e società Deloitte: l’obiettivo della prima fase del progetto è stato quello di operare in materia dei licenziamenti per giusta causa, inserendo i provvedimenti emessi dal distretto nell’elaboratore elettronico, al fine di rendere comprensibili i precedenti giurisprudenziali e prevedibili le decisioni, scoraggiando il contenzioso.

Si deve anche ricordare il progetto della Scuola Superiore Sant’Anna di Pisa, denominato Giurisprudenza Predittiva e rinnovato dal Tribunale di Genova. Questo è costituito da un sistema informativo che analizza i giudici e i relativi documenti processuali, attenendosi ai criteri e alle metodologie sviluppate dall’Observatory on Personal Injuries, utilizzati da aree di contenzioso diverse da quelle riguardanti i danni non monetari. La medesima materia viene, inoltre, analizzata attraverso il machine learning, per l’annotazione e l’estrazione automatica di informazioni da testi di legge e nella programmazione di algoritmi di analisi predittiva. Scopo del sistema è di riprodurre i ragionamenti posti alla base della sentenza giudiziale, al fine di rendere prevedibili decisioni future nella stessa materia, evidenziando la ratio decisionale.

Anche in ambito tributario è stato sponsorizzato il progetto Prodigit, volto a creare sistemi algoritmici in grado di analizzare le leggi, le sentenze e i contributi dottrinali, al fine di prevedere il probabile orientamento decisionale in una determinata questione giuridica. Il computer analizzerà un notevole numero di sentenze, attraverso il machine learning, consentendo al contribuente di ottenere una risposta sull’opportunità, o meno, di presentare il ricorso.

4.RIFLESSIONI SUL CASO COMPAS: LA DISPUTA TRA NORTHPOINTE E PROPUBLICA

In tutti i sistemi di giustizia penale sovraccarichi e affollati, fattori come la rapidità, l’efficienza, la facilità di gestione e la chiara organizzazione dei dati sui rischi e i bisogni sono fondamentali. Nel marzo 2015 è stato presentato l’algoritmo COMPAS dalla compagnia Northpointe allo scopo di fornire un valido strumento per ottimizzare questi fattori. COMPAS affronta questo compromesso in diverse modalità: fornisce un insieme di fattori di rischio emersi dalla letteratura criminologica e consente di personalizzare il software. Per cui, la facilità d’uso, l’efficace gestione del tempo e le varie considerazioni su come gestire i casi, considerate difficili da raggiungere attraverso la giustizia penale, possono essere raggiunti attraverso COMPAS.

COMPAS è costituito da scale di rischio predittive per la previsione del rischio e da scale di bisogno separate per identificare i bisogni del programma, nei settori dell’occupazione, dell’alloggio e dell’abuso di sostanze. Le agenzie tenendo conto del principio di rischio, vanno a programmare il trattamento degli individui che presentano un elevato punteggio di rischio di recidiva e di bisogno di trattamento (ad esempio, un elevato consumo di sostanze). Tutti i punteggi della scala COMPAS vengono trasformati in punteggi decili. Questi si ottengono classificando i punteggi della scala di un gruppo normativo in ordine ascendete e poi andando a dividere questi punteggi in dieci gruppi con le stesse dimensioni. I decili vanno da un minimo (1) ad un massimo (10). Il grado decile ha la seguente interpretazione: punteggio della scala da 1 a 4: è basso rispetto agli altri autori di reato del gruppo di riferimento – punteggio della scala da 5 a 7: è medio rispetto agli altri autori di reato del gruppo di riferimento – punteggio della scala da 8 a 10: è alto rispetto agli altri autori di reato del gruppo di riferimento.

I punteggi decili possono essere interpretati in senso relativo e sono legati al gruppo di riferimento. Per alcune scale non si può suddividere il campione in dieci gruppi di dimensioni uguali, di conseguenza è necessario saltare alcuni punteggi decili. In questo caso, viene utilizzato un algoritmo per punti di taglio che va a dividere gli autori di reato nel maggior numero possibile di gruppi di dimensioni approssimativamente uguali.

Il ruolo di Northpointe, società che ha sviluppato COMPAS, è stato quello di documentare i risultati delle ricerche condotte da più studi per dimostrare che il loro prodotto era affidabile, ossia che le scale di misurazione sono valide e coerenti e che le scale di rischio hanno validità predittiva.

È il caso di citare l’analisi di COMPAS condotta da ProPublica, organizzazione statunitense che mira a produrre giornalismo investigativo di interesse pubblico. ProPublica si è proposta di valutare la rigorosità di fondo dell’algoritmo di recidiva COMPAS.

L’analisi è stata condotta a seguito di due episodi di furto su circa 10.000 imputati della contea di Broward in Florida. Dalle analisi è stato rilevato che gli imputati neri avevano molte più probabilità di quelli bianchi di essere erroneamente giudicati a rischio di recidiva, mentre gli imputati bianchi avevano maggior probabilità di quelli neri di essere erroneamente segnalati come a basso rischio. Gli imputati in carcere sono tenuti a rispondere al questionario COMPAS, le loro risposte vengono inserite nel software per generare i punteggi, tra cui le previsioni del “rischio di recidiva” e del “rischio di recidiva violenta”.

Ogni imputato ha ricevuto tre punteggi da COMPAS: “Rischio di recidiva”, “Rischio di violenza” e “Rischio di mancata comparizione”. I punteggi COMPAS per ogni imputato andavano da 1 a 10, e partendo da questi punteggi hanno costruito un profilo della storia criminale di ogni persona. In seguito, questi sono stati confrontati con circa 80.000 registri penali scaricati dal sito web del Broward County Clerk’s Office. Inoltre, è stata anche determinata l’etnia, adottando le classificazioni delle etnie utilizzate dall’Ufficio dello sceriffo della contea di Broward, che identifica gli imputati come neri, bianchi, ispanici, asiatici e nativi americani.

Successivamente è stato compilato il record di incarcerazione di ogni persona, utilizzando i registri della contea di Broward e altri registri pubblici delle carcerazioni disponibili sul sito web del Dipartimento di correzione della Florida. Però, è stato riscontrato che i dati delle persone sono stati inseriti in modo errato in alcuni registri, portando a delle corrispondenze errate tra il punteggio COMPAS di un individuo e i suoi precedenti penali.

Per le analisi condotte da ProPublica è stata fondamentale la definizione di recidiva. Il concetto è stato interpretato come un reato che ha portato alla registrazione in carcere e che è avvenuto dopo il reato per il quale la persona ha ottenuto il punteggio COMPAS. Per abbinare i punteggi COMPAS ai casi, sono stati analizzati le date di arresto o di imputazione di ciascun caso. Per la recidiva violenta è stata adottata la definizione di crimine violento dell’FBI, che comprende omicidio, omicidio colposo, stupro, rapina e aggressione aggravata. Mentre, per il resto dell’analisi la recidiva è stata definita come un nuovo arresto entro due anni come confermato d’altra parte da un recente studio della Commissione per le sentenze degli Stati Uniti.

Le analisi di ProPublica hanno mostrato che gli imputati neri sono spesso a rischio di recidiva più alto, mentre gli imputati bianchi sono stati classificati come meno rischiosi. Obiettivo dell’analisi è stato anche quello di mostrare che, anche controllando i reati precedenti, la recidiva futura, l’età e il sesso, gli imputati neri avevano il 45% in più di probabilità di essere assegnati a punteggi di rischio più elevati rispetto agli imputati bianchi. Gli imputati neri avevano anche una probabilità doppia rispetto a quelli bianchi di essere classificati erroneamente come a maggior rischio di recidiva violenta. Inoltre, gli imputati bianchi recidivi violenti avevano il 63% in più di probabilità di essere classificati erroneamente a basso rischio di recidiva violenta, rispetto agli imputati neri recidivi violenti. Scopo dell’analisi di recidiva violenta è stato quello di mostrare che anche controllando i reati precedenti, la recidiva futura, l’età e il sesso, gli imputati neri avevano il 77% in più di probabilità di essere assegnati a punteggi di rischio più alti rispetto agli imputati bianchi.

A sua volta, la compagnia Northpointe ha risposto formalmente alle accuse di pregiudizi razziali nelle scale COMPAS mosse da ProPublica, attraverso il report “COMPAS Risk Scales”. Il documento contiene una spiegazione degli errori identificati dalla loro revisione e una discussione tecnica dettagliata sui tre risultati chiave della loro analisi dei dati corretta dal punto di vista metodologico: ProPublica si è concentrata su statistiche di classificazione che non tenevano conto dei diversi tassi base di recidiva per i neri e i bianchi. L’uso di queste statistiche ha portato ad affermazioni false nel loro articolo; se si utilizzano le statistiche di classificazione corrette, i dati non confermano l’affermazione di ProPublica di pregiudizio razziale nei confronti dei neri; l’interpretazione dei risultati nei campioni utilizzati da ProPublica dimostra che la General Recidivism Risk Sale e la Violent Recidivism Risk Scale sono accurate per neri e bianchi.

Queste sono le affermazioni da parte di Northpointe riguardo all’articolo realizzato da ProPublica rispetto al loro risultato. Questo potente dibattito pubblico tra Northpointe e ProPublica ha irrimediabilmente acceso la discussione tra gli scienziati, gli esperti della comunità scientifica e il pubblico. Non essendoci la certezza su chi abbia ragione o meno, riguardo a ciò sono stati pubblicati molteplici articoli a sostegno dell’una o dell’altra parte, eppure la questione rimane ancora aperta.

Autore

Carmen Verde

26 anni
Laurea triennale in scienze politiche- laurea magistrale in Scienze della politica
Master di II livello in pubblica amministrazione
Dottoranda in scienze giuridiche e sociali per l’innovazione (settore diritto medievale e moderno)
Provenienza: dipartimento di scienze politiche Vanvitelli

GIUSTIZIA PREDITTIVA E COSTITUZIONE: LIMITI E RISCHI DELL’USO DEGLI ALGORITMI NELLE DECISIONI GIUDIZIARIE

1.FONDAMENTI GIURIDICI DELLA GIUSTIZIA PREDITTIVA

2.I LIMITI COSTITUZIONALI DELLA GIUSTIZIA PREDITTIVA

4.RIFLESSIONI SUL CASO COMPAS: LA DISPUTA TRA NORTHPOINTE E PROPUBLICA

Autore