La catena di montaggio dell'intelligenza artificiale

La catena di montaggio dell'intelligenza artificiale

11.07.2019 | Dietro a ogni scintillante nuovo algoritmo ci sono migliaia di lavoratori manuali. Ma di che cosa si occupano?

Lavoro e intelligenza artificiale: un tema particolarmente scottante che fa subito pensare alle funeste previsioni sul futuro dell’occupazione. Lo studio più famoso sul tema è ancora oggi quello compiuto dall’università di Oxford, che ha calcolato come il 47% degli impieghi potrebbe essere automatizzato grazie all’evoluzione del machine learning.

Se il futuro del lavoro, a causa dell’intelligenza artificiale, presenta alcune incognite, nel presente c’è invece da registrare un fenomeno opposto: l’esplosione di una nuova industria che sta dando lavoro a centinaia di migliaia di persone in tutto il mondo. È il data labeling (etichettatura dei dati), il lavoro assolutamente manuale senza il quale non sarebbe possibile sviluppare gli algoritmi di machine learning che oggi ci consentono di riconoscere i volti (o gli oggetti) che appaiono nelle foto, di comunicare con gli smart speaker che hanno invaso le nostre case o di sviluppare le auto a guida autonoma.

Ma di cosa si occupano i lavoratori dell’industria del data labeling? Per capirci qualcosa, bisogna partire dal principio. Un algoritmo di machine learning è essenzialmente un modello statistico estremamente complesso, che impara come portare a termine in autonomia un determinato compito dopo aver analizzato le centinaia di migliaia di dati che gli sono stati dati in pasto. Per riconoscere un gatto in una foto, per esempio, l’intelligenza artificiale analizza una miriade di immagini in cui possono o meno essere presenti dei gatti. Dopo una lunghissima serie di tentativi ed errori (in cui gli viene indicato se ha riconosciuto correttamente la presenza di gatti), l’algoritmo di machine learning impara in autonomia e senza bisogno di ulteriore programmazione a riconoscere questi animali con un’accuratezza straordinaria.

Per riuscire in questa impresa, è prima di tutto necessario che qualcuno etichetti ogni immagine utilizzata dall’intelligenza artificiale, segnalando cos’è presente in quella foto. Chi svolge questo lavoro? In parte, lo svolgiamo tutti noi utenti di internet. Vi siete mai chiesti perché nei Captcha Code – quello strumento che sul web ci permette di dimostrare che siamo essere umani (e non bot utilizzati a scopi malevoli) – dobbiamo quasi sempre indicare in quali foto sono presenti dei cartelli stradali o delle automobili?

Un esempio di etichettatura dei dati (fonte: Nvidia)

La risposta è abbastanza semplice: reCaptcha, il sistema più utilizzato, è stato sviluppato da Google. La stessa Google è proprietaria di Waymo, che è all’avanguardia nello sviluppo di auto autonome. In questo modo, l’azienda di Mountain View può cogliere i proverbiali due piccioni con una fava: dimostrare che gli utenti che stanno cercando di accedere a un sito web sono effettivamente degli esseri umani e contemporaneamente etichettare una miriade di immagini che serviranno poi ad addestrare l’algoritmo che guida le vetture autonome.

Nella maggior parte dei casi, però, questo lavoro di etichettatura è troppo complesso per essere svolto da utenti sconosciuti: c’è invece bisogno di veri e propri professionisti del mestiere. Ed è attorno a questa necessità che si sono sviluppate una quantità di aziende, situate principalmente in Cina (ma l’industria è fiorente anche in Africa). Basic Finder e Mada Code, per esempio, si trovano appena fuori Pechino e danno lavoro a circa 10mila persone ciascuna, collaborando con realtà come Microsoft e la prestigiosa università Carnegie Mellon.

Altre fabbriche più piccole si trovano invece nei dintorni di Guiyang, Shandong, Henan, Hebei e Shanxi. “Siamo i muratori del mondo digitale”, ha detto al New York Times Yi Yake, co-fondatore di Ruijin Technology. “Il nostro lavoro è di posare un mattone dopo l’altro. Ma il nostro è un ruolo fondamentale nel campo del machine learning, senza di noi non si potrebbero costruire i grattacieli”.

Ma come funzionano, in pratica, questi lavori? Svolti in alcuni casi da remoto (e coordinati dalla sede centrale) o direttamente in enormi uffici, gli addetti a quella che potremmo chiamare la catena di montaggio dell’intelligenza artificiale si dividono in base all’addestramento a cui i dati sono destinati. Chi si occupa di riconoscimento immagini, dovrà segnalare accuratamente tutto ciò che compare in una foto (non solo i gatti del nostro esempio, ma anche se nell’immagine sono presenti persone, macchine, lampade, smartphone e quant’altro). 

 
È impossibile affidare alle macchine stesse il compito di addestrarne altre: solo gli esseri umani, almeno per il momento, sono sufficientemente affidabili

Chi invece si occupa di riconoscimento vocale dovrà etichettare quali parole vengono dette in centinaia di registrazioni audio, per segnalare all’algoritmo tutte le inflessioni e pronunce con cui si può dire, per esempio, la parola “bicicletta” (che all’interno di ogni nazione viene pronunciata diversamente a seconda della zona di provenienza). Chi invece si occupa di smart speaker, dovrà segnalare tutti i differenti modi in cui possiamo dire al nostro assistente digitale di accendere le luci, far partire una canzone o alzare la temperatura di casa. 

Il lavoro, quindi, non è così semplice o automatico come potrebbe sembrare in primo luogo. Ed è per questo che è impossibile affidare alle macchine stesse il compito di addestrarne altre: solo gli esseri umani, almeno per il momento, sono sufficientemente affidabili. Nel caso di una foto con svariati oggetti, per esempio, si stima che un lavoratore esperto sia in grado di etichettare non più di 40 immagini al giorno; una cifra che può scendere fino a 10 in caso di immagini particolarmente ricche di dettagli.

Ma perché questa nuova industria si è sviluppata in Cina? La ragione è molto semplice: nella Repubblica Popolare, le leggi che regolano la privacy sono molto meno rigide che nel resto del mondo; questo consente alle aziende di data labeling di avere accesso a un bacino inesauribile di dati provenienti da tutti gli utenti internet dei suoi 1,4 miliardi di abitanti.

Sarebbe quindi sbagliato pensare a questa industria come a una sorta di scantinato dell’intelligenza artificiale. Certo, i luoghi in cui viene svolto il lavoro hanno poco a che spartire con gli scintillanti campus di Apple, Amazon o Baidu; si tratta però di normali uffici in cui lavorano dipendenti che in alcuni casi devono essere specializzati.

 

Oltre a riconoscere gli oggetti, questo sistema di machine learning indica il livello di confidenza (fonte: Sigmoidal)

Gli algoritmi di machine learning si occupano infatti anche di compiti particolarmente delicati, come riconoscere i tumori presenti nelle radiografie. Ad etichettare questi dati, ovviamente, non può essere un normale lavoratore dalle competenze generiche, ma soltanto un radiologo. Nella maggior parte dei casi, comunque, basta applicare il buon senso ed essere dotati di pazienza, precisione e accuratezza. 

Ma quanto è destinato a durare questo nuovo business? “Al momento c’è grande richiesta”, ha spiegato al South China Morning Post Yi Xiangzhi, chief scientist di UniDT Technology. “Ma questa industria potrebbe avere solo altri cinque anni di vita”. La causa sta soprattutto nella costante evoluzione del machine learning, che ha bisogno di sempre meno dati per essere addestrato e che, in alcuni casi, è ormai in grado di creare da solo i dati che gli servono (per esempio, producendo migliaia di fotografie di volti umani).

Anche un’industria che, per definizione, è al servizio dell’automazione potrebbe quindi diventare vittima dell’automazione stessa. Nel frattempo, però, l’intelligenza artificiale potrebbe dare vita a nuovi lavori oggi ancora inimmaginabili. Proprio come sarebbe stato impossibile, dieci anni fa, immaginare la nascita del data labeling.

 
l'autore
Andrea Daniele Signorelli