fbpx Le macchine Volanti | I’m not a robot: lo strano mondo dei Captcha
I’m not a robot: lo strano mondo dei Captcha

I’m not a robot: lo strano mondo dei Captcha

30.01.2020 | Addestrare intelligenze artificiali, digitalizzare libri e dimostrare di essere persone: pro e contro dei codici antibot

Prima di accedere a una piattaforma web, è spesso necessario affrontare uno strano passaggio. Sotto la scritta “I’m not a robot” bisogna infatti spuntare una casella che a volte reca la dicitura “conferma di essere un umano”. È uno strano mondo, quello in cui viviamo: invece di chiedere a robot e simili di dimostrare la loro natura artificiale, siamo noi che dobbiamo confermare di essere delle persone in carne e ossa. 

Ma perché avviene tutto questo? Viviamo davvero in un mondo in cui siamo noi umani a dover superare il test di Turing, al contrario di quanto immaginato in film come Blade Runner? Ovviamente, le ragioni dietro a tutto ciò sono molto meno fantascientifiche. Quando spuntiamo la casella “I’m not a robot” stiamo infatti risolvendo un Captcha Code, vale a dire un completely automated public Turing test to tell computers and humans apart (“test di Turing pubblico e completamente automatizzato per separare computer e umani”).

Questi strumenti hanno uno scopo ben preciso: servono a evitare che alcuni siti – soprattutto quelli che offrono servizi – vengano inondati di richieste da parte dei cosiddetti bot: programmi automatici che possono eseguire la stessa operazione a ripetizione. In poche parole, assicurarsi che dall’altra parte dello schermo ci sia un essere umano aiuta a impedire che internet sia inondato da spam, tentativi di truffa e molto altro ancora.

Ma come funziona questo sistema e perché è in grado di riconoscere che sia proprio un essere umano quello che ha inserito la spunta? Come ha spiegato l’esperto di informatica Gurmeet Heera, uno dei vantaggi di Google (proprietaria di reCaptcha, la più importante società del settore) è quello di possedere un’enorme quantità di dati. Tra questi, ci sono anche quelli relativi al movimento dei mouse utilizzati dagli utenti umani.

“Prima di tutto, un sistema deve quindi essere addestrato a prevedere se l’utente sia umano o meno”, scrive Heera. “Per fare questo, c’è bisogno di dati relativi ai movimenti del mouse da parte degli umani e alle operazioni compiute invece dai programmi informatici. Quindi, quando spuntate la casella, il sistema analizza i movimenti compiuti e valuta quanto siano riconducibili al modo in cui gli uomini solitamente spostano il cursore sullo schermo”. Un comportamento che è molto diverso da quello eseguito da un bot, che deve prima scaricare tutta la pagina e poi selezionare la casella agendo attraverso il codice: una modalità peculiare, che in quanto tale viene riconosciuta dal sistema.

Ma questo non è l’unico esempio di Captcha Code. Fino a qualche anno fa, il sistema più diffuso richiedeva all’utente di decifrare alcune lettere leggermente distorte e poi di trascriverle nell’apposito box. In questo caso, il trucco era più intuibile: solo gli esseri umani sono veramente precisi a decifrare la grafia umana (o simile a essa). Di conseguenza, riuscire a interpretare correttamente quelle lettere diventava la dimostrazione che nessun bot stava cercando di accedere a una pagina in maniera fraudolenta.

Un sistema che, tra l’altro, potrebbe aver consentito la digitalizzazione di milioni di libri e articoli, aumentando a dismisura e rapidamente la diffusione della conoscenza e della cultura fino a quel momento presente solo su carta, rendendola disponibile ovunque e accessibile direttamente da internet. Ricorderete infatti che le parole da decifrare erano sempre due. La ragione a questo punto è chiara: una parola rappresentava il test che dovevamo superare (e di cui quindi il sistema conosceva la risposta corretta), l’altra era invece la parola di cui era necessaria la trascrizione. Indovinando la prima, dimostravamo di essere attendibili anche per la seconda.

Non è tutto. Coincidenza vuole che, proprio negli stessi anni in cui si diffondeva questo sistema di autenticazione, si stesse assistendo alla diffusione del deep learning, il sistema alla base dell’intelligenza artificiale come la intendiamo oggi. Non è quindi per caso che, ormai da parecchio tempo, i Captcha si sono concentrati sulle immagini, costringendoci a individuare tutte le foto in cui è presente una macchina, dei cartelli stradali, dei gatti o altro ancora.

Ogni volta che indichiamo in un Captcha che cos’è presente nelle fotografie che ci vengono mostrate, non stiamo facendo altro che aiutare l’intelligenza artificiale a diventare sempre più brava a riconoscere gli oggetti che la circondano, un sistema noto come image recognition. Nel deep learning, infatti, la macchina viene addestrata utilizzando una quantità immensa di fotografie che sono già state etichettate indicando cosa si trovi al loro interno. A furia di analizzarle, l’algoritmo impara a riconoscere autonomamente alcuni oggetti e può in seguito eseguire quel compito in autonomia.

Quando suddividiamo le foto nei Captcha, quindi, stiamo contribuendo attivamente all’addestramento di un’intelligenza artificiale, che verrà poi utilizzata per permetterci di navigare nell’archivio fotografico che abbiamo salvato nel cloud e trovare, per esempio, le foto in cui appare una bicicletta o che sono state scattate al mare.

Ma perché così frequentemente ci viene richiesto di riconoscere delle automobili, dei cartelli stradali o altri oggetti che hanno a che fare con la guida? La ragione è molto semplice: la image recognition è un aspetto fondamentale per i sistemi di guida autonoma, che devono imparare a riconoscere con estrema precisione tutto ciò che è presente nell’ambiente in cui si muovono.

La competizione per la conquista di vere e proprie self driving cars è una delle più complesse tra quelle in corso di svolgimento tra i colossi del digitale: non stupisce, di conseguenza, che proprio in questo ambito siano state messe all’opera le centinaia di milioni di persone che ogni giorno devono affrontare i Captcha Code per accedere a un determinato servizio online.

Cosa succederebbe, però, se chiedessimo proprio a un’intelligenza artificiale di risolvere i Captcha? È la domanda che si è posto nel 2017 lo sviluppatore Francis Kim, che ha così provato a far risolvere i test a uno dei tanti software di deep learning che, già oggi, sono in grado di riconoscere gli oggetti e le persone presenti in una foto con una buona accuratezza.

Per l’esperimento è stato utilizzato il sistema di image recognition noto come ClarifAI, che pur non riuscendo a superare il test con la stessa costanza di un essere umano ha comunque dimostrato come sia possibile usare un’intelligenza artificiale per addestrarne un’altra. Un corto circuito che dimostra come, anche grazie ai piccoli task che eseguiamo quotidianamente, distinguere accuratamente l’opera di un robot da quello di un essere umano stia diventando sempre più difficile.

 

l'autore
Andrea Daniele Signorelli

Vivere in eterno

Il mind uploading al momento è ancora un’utopia, ma alcune startup stanno già creando un mercato dell’immortalità.