L'impatto dei big data

L'impatto dei big data

06.11.2017 | Come viene usato il “petrolio digitale” in Italia e quali sono le sue applicazioni più importanti?

Cinquantacinque aziende utilizzano i dati aperti, pubblicati da 39 pubbliche amministrazioni (nazionali o locali), per “generare prodotti e servizi e creare valore sociale ed economico”. È questo il primo dato che emerge collegandosi a Open Data 200 Italy. Grazie a una visualizzazione interattiva, attraverso pochi e semplici movimenti del mouse è possibile interrogare più a fondo il portale, scoprire la provenienza degli open data e quante e quali imprese li utilizzano.

Open Data 200 è la versione italiana dell’americano Open Data 500, lanciato nel 2014 da TheGovLab. L’obiettivo alla base del progetto a stelle e strisce era quello di fornire un’evidenza tangibile del fatto che gli open data possono alimentare l’attività economica. Insomma, dopo aver ripetuto per anni che i dati aperti erano “il petrolio dell’era digitale” (Neelie Kroes, ex commissario UE per l’Agenda digitale), si è voluto fornire una mappa di chi si era messo a raffinare quel “petrolio”. Come ha evidenziato Beth Simone Noveck, direttrice di TheGovLab: «Sono tre i fattori che abilitano l’utilizzo degli open data: renderli disponibili in modo affidabile e coerente; rilasciare e aggiornare i dati con la frequenza necessaria per essere utili alle imprese; poter contare su aziende che investono nelle competenze e negli strumenti necessari per pulire, analizzare e aggregare i dati in modo efficace».

Avere una fotografia chiara dell’esistente e mostrare le buone pratiche sono punti di partenza essenziali per dar vita a un ecosistema dei dati funzionante. Nel 2015, la Fondazione Bruno Kessler decide di importare il modello americano in Italia. Dopo due anni di ricerche, analisi e interviste, Open Data 200 è online. Non si tratta di un semplice strumento per valutare l’impatto degli open data in Italia; OD200 si propone di stimolare il dialogo sul tema dei dati aperti tra istituzioni e imprenditoria, di intercettare la domanda di open data e facilitare l’incontro tra domanda e offerta.

 

L'avvento di internet ha reso possibile una diffusione senza precedenti di dati.

E non è casuale, che il portale sia nato proprio adesso, con il tema open data tornato al centro dell’attenzione, in modo meno enfatico e più maturo. Dopo una fase di hype e quella successiva, inevitabile, di delusione, in cui ci si è resi conto che gli open data non erano la risposta a tutti i problemi, ora, senza fuochi d’artificio, i dati aperti sono una realtà, vengono utilizzati e iniziano a funzionare. Negli ultimi due anni, in Italia, sono stati fatti grossi passi avanti sul tema dei dati, dall’approvazione del Freedom of Information Act (FOIA) del 25 maggio 2016, al rilascio del terzo Piano di azione italiano OGP, nel settembre dello stesso anno, mese in cui è stato anche creato il Team Digitale, che a sua volta ha lanciato il DAF, Data & Analytics Framework e a inizio 2017 developers.ita, comunità di sviluppatori di servizi pubblici digitali.

A confermare questo percorso positivo, nella classifica annuale di OpenData Barometer, dal 2014 l’Italia continua a guadagnare posizioni a livello internazionale, arrivando ad occupare la ventesima piazza, nell’ultima rilevazione. Il report evidenzia però anche un altro elemento interessante, che caratterizza il rapporto dell’Italia con gli open data fin dagli albori: gran parte dell’attenzione mediatica e politica si è concentrata sugli open data come strumento di trasparenza, lasciando in secondo piano il loro valore come infrastruttura capace di incentivare l’iniziativa privata. Il Barometro indica infatti un elevato impatto “politico” dei dati aperti (con 55/100), a fronte di un impatto economico di 32/100 e un impatto sociale pari a zero.

Open Data 200 nasce dunque in un momento in cui il paese sembra accelerare sul tema open data, anche se non manca qualche criticità. Francesca De Chiara, della Fondazione Bruno Kessler e motore del progetto, evidenzia una scarsa partecipazione da parte della Pubblica Amministrazione: «Individuare la domanda di dati, scoprirne il loro utilizzo, dovrebbe aiutare la PA ad avviare processi di apertura dei dati più efficaci e funzionali. Un impegno del pubblico sarebbe importante, ma per il momento non si è andati oltre una forte manifestazione di interesse. Inoltre, spesso si forniscono dati e classifiche sul numero di dataset rilasciati in formato aperto, ma la qualità non la controlla nessuno». E anche da un punto di vista quantitativo si potrebbe migliorare: il numero generico dei dataset è di scarso interesse. Sarebbe più utile individuare una sorta di paniere standard di open data da usare come riferimento, in questo modo si fornirebbero indicazioni preziose anche alle Pubbliche Amministrazioni su quali dati rilasciare, con che tempi, in quali formati. Le linee guida ci sono e sono di alto livello, manca la declinazione pratica, col Team Digitale sembra si stia andando in questa direzione.

 
Molte aziende usano fonti alternative di dati, facendo ricorso a sorgenti aperte e collaborative come Wikipedia o OpenStreetMap.

E forse Open Data 200 potrà essere un ulteriore aiuto. È vero che delle oltre 300 aziende contattate, sono solo 55 quelle che avevano i requisiti per essere inserite nel portale. Ma qualche primo risultato inizia a vedersi: già in questa fase embrionale, si stanno gettando le basi per possibili collaborazioni future, tra le aziende censite sul portale. Inoltre, accanto a realtà consolidate, come Cerved o SpazioDati, sono emerse giovani startup di altissimo livello, come Studio Mapp, che con Qirate, usando dati geografici, misura la qualità della vita di un determinato luogo, arrivando al dettaglio del numero civico.

Più in generale, Open Data 200 permette di identificare tendenze, opportunità e necessità di chi lavora con gli open data. Il segmento principale di mercato in cui operano le aziende censite è il B2B, il mercato tra aziende (con il 47%), soprattutto attraverso servizi di analisi e rielaborazione di dati utili a terzi. Segue col 37% il nucleo di aziende che lavorano nei servizi verso la pubblica amministrazione, mentre solo il 17% sviluppa soluzioni per i consumatori. Le aziende che usano maggiormente gli open data sono quelle che operano nei settori tecnologico, dati, software e la pubblica amministrazione; mentre i dataset più utilizzati sono quelli geospaziali (23%), anche grazie al progetto europeo INSPIRE che ha fatto un po’ di ordine in materia, seguiti dai dati turistici e de quelli ambientali, che si attestano al 12%.

Ci sono altri due aspetti particolarmente interessanti: molte aziende usano fonti alternative di dati, facendo ricorso a sorgenti aperte e collaborative, quali Wikipedia e OpenStreetMap, come a dire, che se un’azienda vuole lavorare con i dati, se li va a cercare dove trova quelli utili. Inoltre, non sempre i dati vengono utilizzati come ci si potrebbe immaginare: per esempio, quelli rilasciati dal Ministero della Salute sono usati in gran parte da aziende che lavorano nel settore del turismo, dove è molto richiesto il dataset delle farmacie georeferenziate. Guardando poi ai principali prodotti creati dagli open data, il podio è così composto: sul gradino più alto troviamo sviluppo web & mobile, con il 34%; secondo posto per gli strumenti di visualizzazione dati (29%); chiude l’analisi a supporto di decisioni strategiche con il 15%. Si tratta di quelle famose decisioni “data driven”, che all’esplosione del fenomeno Open Data, tra 2009 e 2010, sembravano promettere l’infallibilità assoluta; superati gli alti e bassi, ora si consolidano come preziosi supporti decisionali.

 

Negli ultimi due anni sono stati creati il 90% dei dati prodotti in tutta la storia dell'umanità. 

Osservando la mappa geografica delle aziende censite è possibile notare che più del 50% sono concentrate tra il Nord Italia e il Lazio, ricalcando quello stesso “data divide” evidenziato dal rapporto annuale dell’Agenzia per l’Italia Digitale. Dalla ricerca condotta da Francesca De Chiara emerge che, fatte salve poche eccezioni, i modelli di business basati sugli open data faticano a essere sostenibili. Uno dei principali problemi è legato al fatto che vengono aperti pochi dati di qualità, dotati di un valore commerciale (ecco l’utilità del “paniere” di cui si diceva). I dati più importanti per fare Open Data sarebbero quelli del Registro delle Imprese: se si avessero i dati camerali da arricchire si potrebbero sviluppare progetti interessanti. Altro aspetto da non trascurare è la resistenza delle PA a pubblicare dati che potrebbero risultare incompleti o errati, rallentando così i tempi di rilascio dei dataset. La strada da seguire è quella indicata già nel 2013 da Stephan Shakespeare, CEO di YouGov: «L'ideale non dovrebbe essere nemico del bene». Per semplificare: «Facciamo una beta permanente», propone Federico Morando, CEO di Synapta e fellow del Centro Nexa for Internet & Society. «Che non vuol dire fare progetti raffazzonati, ma liberare dati utili, anche se non sono perfetti, allineandoci alle buone pratiche esistenti».

Open Data 200 può rivelarsi uno strumento interessante per spingere in questa direzione: offrendo un quadro significativo sullo stato di salute dell’open data in Italia, può fornire suggerimenti per migliorare l’implementazione delle politiche nazionali di valorizzazione del patrimonio informativo reso disponibile dalla PA, tenendo conto anche delle richieste e delle aspettative delle aziende che operano nel settore. Uno dei prossimi passi del portale sarà sviluppare la parte narrativa per approfondire la storia e l’attività delle aziende. Inoltre è stato sviluppato un grafico relazionale che mette in relazione produttori di dati e loro fruitori e altri grafici interessanti per capire meglio come e da chi vengono usati i dati. A breve saranno disponibili online, assieme alle nuove candidature che sono in fase di valutazione.

In attesa degli sviluppi futuri, c’è il presente e le 55 aziende che popolano OD200. Uno spaccato interessante per iniziare a capire cosa fa chi utilizza i dati aperti per fare business. Già citati i casi di Cerved e SpazioDati; Synapta si occupa di data curation, promettendo “linked data per davvero”, per risolvere i problemi quotidiani di chi deve misurarsi con i dati, siano essi aziende, pubbliche amministrazioni o cittadini. Ci sono eccellenze, come Planeteck Italia, di stanza a Bari, che si propone di semplificare l’utilizzo dei dati geospaziali per comprendere meglio il mondo. I campi di applicazione sono i più svariati: dal monitoraggio ambientale all’open-government, dalle smart cities alle soluzioni per la sicurezza.

 

O ancora, Rethink, attiva in campo energetico e ambientale, che con InSymbio offre il primo marketplace che permette di trasformare il problema degli scarti e dell’invenduto in profitto, grazie all’economia circolare. Nell’elenco compaiono software house, aziende consolidate, startup e realtà che lavorano con i dati aperti ormai da tempo, come DEPP, società nata a valle del progetto OpenPolis, che vanta tra i suoi prodotti OpenCoesione, vero fiore all’occhiello degli open data tricolori. Si tratta del primo portale che monitora l’attuazione degli investimenti programmati da Regioni e amministrazioni centrali dello Stato, con le risorse per la coesione. Partito col ciclo 2007 – 2013, oggi si concentra sulla programmazione 2014 – 2020: i dati vengono pubblicati affinché i cittadini possano valutare se i progetti corrispondono ai loro bisogni e se le risorse vengono impegnate in modo efficace, introducendo una forma di controllo dal basso.

Le buone pratiche di utilizzo dei dati iniziano a crescere e anche quelle di rilascio non mancano, bisognerebbe solo condividerle maggiormente. Una sfida cruciale è quella del riuso. La strada è segnata, d’altronde «I dati si chiamano così perché vanno dati, altrimenti si chiamerebbero “tenuti”», come sottolineò dalla platea un anonimo partecipante all’incontro con David Osimo, durante Forum PA 2010.

 
l'autore
Luca Indemini

Nato a Torino, collabora con La Stampa dalla fine degli anni ‘90 occupandosi di cultura e politiche digitali. Lavora come ufficio stampa del Consorzio TOP-IX (innovazione tecnologica). Riveste il ruolo di tutor per il laboratorio di testata online del Master in giornalismo “Giorgio Bocca” di Torino.