• About Author

  • Tutta l'Informazione Ninja nella tua mail

  • “I Big Data sono già disponibili, ma non siamo ancora in grado di sfruttarli al massimo”

    Intervista al Professor Paolo Atzeni del Dipartimento di Ingegneria dell'Università Roma Tre

    18 Maggio 2018

    Si tiene il 18 e il 19 maggio a Roma, la più grande conferenza italiana sul mondo dei dati e sull’innovazione. Data Driven Innovation è l’appuntamento annuale in cui data scientist e addetti ai lavori raccontano come la cultura dei dati sta cambiando la nostra società e la nostra economia. LEGGI ANCHE: Che cosa sono gli Smart Data e come si distinguono dai Big Data Non si tratta della classica conferenza sul mondo della Data Science, ma è una full immersion sulla portata innovativa dei dati in tutti i settori della società e dell’economia. In una società sempre più digitale, in cui siamo tutti produttori e consumatori (anche inconsapevoli) di dati, non possiamo più separare la teoria dalla pratica, la disciplina accademica dalle applicazioni reali. Open_data L’evento è rivolto a tutti: studiosi, ricercatori, aziende, studenti, cittadini. È difficile pensare ad un settore della vita umana che non sia toccato oggi dalla necessità di raccogliere, elaborare ed usare grandi quantità di dati. Data Driven Innovation è il luogo in cui gli specialisti della materia si incontrano per fare il punto e spiegano il proprio lavoro al resto della società. Perché i dati non devono spaventare ma anzi costituiscono per tutti una grande opportunità. LEGGI ANCHE: Data Driven Innovation, due giorni a Roma per gli stati generali dei dati Per chiarire alcune questioni legate all’effettiva fruibilità dei dati e a quanto questa innovazione sia di una portata davvero unica, abbiamo rivolto qualche domanda a Paolo Atzeni, Professore e Prorettore alla Didattica dell’Università Roma Tre. atzeni I cittadini hanno (o potrebbero avere) un ruolo attivo nella raccolta dei dati o mettono semplicemente a disposizione i propri, magari inconsapevolmente? «Si tratta di un argomento complesso, perché ovviamente ci sono tantissime esigenze di utilizzo dei dati, ma anche possibilità e disponibilità. La tematica della Driven Innovation va in tante direzioni diverse, di cui i Big Data fanno parte ma non esauriscono il discorso. Oggi si fa spesso riferimento a questo termine per identificare una quantità di dati tale da non poter essere gestita con le misure tradizionali. Per quanto riguarda ciò che normalmente si considera “Open Data”, la base tutt’ora mancante è la possibilità di utilizzare dati, anche relativamente semplici, ma di grandi utilità».

    Bilanci comunali e puntualità dei mezzi di trasporto

    Ci riferiamo, ad esempio, a dati che riguardano i bilanci comunali o alle informazioni sulla puntualità dei trasporti. Sono dati importanti di cui non abbiamo disponibilità: se ho bisogno di certe informazioni ho difficoltà a reperirle e incrociarle. Il vero problema di questo insieme di dati non risiede nella raccolta, ma riguarda principalmente due aspetti: da un lato, dobbiamo presumere che le informazioni siano ben descritte e di buona qualità (e non è affatto una certezza); dall’altro manca la possibilità di incrociare questi con altri dati perché non esiste un format unico e condiviso. Spesso, sui siti delle Pubbliche Amministrazioni locali, rileviamo un gran numero di dataset di informazioni ed è senz’altro positivo perché rispondono ad un requisito di trasparenza, ma niente di più. Un contributo efficace dai parte dei cittadini richiederebbe una gestione del processo che garantisca una adeguata qualità dei contenuti per gli usi a cui sono predisposti. I dati sono una risorsa e quest’attenzione generale sul tema è un buon segnale. Il punto cruciale è che, attualmente, è ancora molto difficile utilizzare davvero questa risorsa a causa della mancanza di disponibilità dei dati, di qualità e omogeneità dei dati e per l’impossibilità di incrociarli a causa delle diverse chiavi con cui sono identificati i diversi gruppi». mf Che ruolo può avere la Pubblica Amministrazione non solo nell’agevolare i processi di Driven Innovation, ma anche indirizzando attività in questo senso? «La Pubblica Amministrazione dovrebbe giocare un ruolo fondamentale, per prima cosa promuovendo e mettendo a disposizione i propri dati, perché in molti casi le Amministrazioni hanno dati che possono risultare davvero utili: per esempio, pubblicare i tassi di occupazione dei miei studenti laureati potrebbe essere davvero interessante, sia per me, per promuovere quei corsi di laurea che hanno successo in questi termini, sia per i futuri studenti e le loro famiglie, che possono conoscere in anticipo quale possibilità di impiego ci sarà in futuro in base alle discipline scelte. I corsi di ingegneria informatica hanno un tasso di occupazione molto alto: circa il 95% dei laureati trova lavoro entro il primo anno, ma un altro dato significativo è che la metà di chi si iscrive non completa il percorso perché la materia è senz’altro complessa e alcuni tra quelli che si iscrivono non hanno ben chiaro l’impegno richiesto per la disciplina e vanno incontro all’insuccesso negli studi. La trasparenza su questi dati è senz’altro utile per prendere decisioni più corrette. Le Università e il Ministero dell’Istruzione stanno lavorando proprio in questo senso. Altro discorso è che pochi dati semplici sono facili da comprendere, ma molti altri sono complicatissimi: tutti chiediamo trasparenza sui bilanci delle Pubblica Amministrazioni ma pochi di noi sarebbero davvero in grado di comprenderne con esattezza i contenuti, scritti secondo criteri contabili previsti da normative che non richiedono certo il criterio della semplicità. Oltre alla disponibilità e alle iniziative di trasparenza “immediata”, è necessario che questi dati vengano forniti in una chiave di lettura effettivamente fruibile. Anche dal punto di vista informatico, la fruibilità è essenziale e le standardizzazioni sono necessarie, anche in campo applicativo». mf2 «Alcuni servizi sono efficacissimi nell’incrociare i dati: se faccio un prelevamento in un Paese lontano, magari in Perù, a poche ore dall’ultimo prelevamento a Roma, vengo immediatamente contattato per verificare l’operazione. Si tratta di una analisi su base statistica: a volte le carte vengono bloccate preventivamente, solo sulla base di tentativi di accesso, senza che si sia verificata una intrusione. Certamente, si tratta di una applicazione davvero efficace dei Big Data, che si basa anche su approcci statistici e di machine-learning che, in tutti i casi, restituiscono una certa percentuale di falsi positivi. In determinate aree, come nella prevenzione al terrorismo, ridurre il numero di falsi positivi ottimizzerebbe gli sforzi impiegati nella lotta al fenomeno, garantendo un numero minore di “errori” legati al metodo statistico». In Italia a che punto siamo? Quali sono le prossime sfide da affrontare? «Penso sia abbastanza difficile fare un bilancio serio. Quel che è certo, è che esistono diverse esperienze più o meno approfondite e sperimentali o produttive. L’esperienza che abbiamo avuto con tutti i contatti coinvolti nell’evento Data Driven Innovation è stata riscontrare un interesse enorme, tanto nella partecipazione in termini di iscrizioni al convegno, quanto nel numero di candidature ricevute per le presentazioni, che spaziano dal traffico, alla salute, alla gestione dell’energia, fino alle discipline umanistiche e a economia e finanza. Lo spazio c’è, le idee anche, ora iniziano ad arrivare anche i risultati». Come si incontrano tutti questi mondi diversi? In relazione a Data Driven Innovation, qual è stato il momento di incontro tra il mondo più istituzionale dell’Università e quello informale dei makers? «Fin dalla prima edizione siamo partiti da esperienze precedenti che l’Università ha maturato nel tempo: abbiamo ospitato per più di dieci anni il Codemotion, abbiamo sempre partecipato al Maker Fair e adesso organizzeremo l’edizione di quest’anno insieme a Innova Camera. Riteniamo, sia perché lo suggerisce la disciplina, sia perché è nel nostro spirito, che questi eventi funzionano se riescono a mettere insieme Università, aziende, singoli e Istituzioni. L’idea è procedere a 360 gradi, coinvolgendo realtà diverse; non sempre è semplice perché i contributi vanno tarati, ma è un compito che abbiamo assunto volentieri. Come Università abbiamo deciso di promuovere il tutto anche con la partecipazione pluridisciplinare: i promotori sono un gruppo di docenti di Ingegneria e Giurisprudenza, a cui poi si sono affiancati, in modo più o meno intenso, diversi colleghi di Economia, di Scienze Politiche, di Lettere. Abbiamo diversi contributi dall’area umanistica in un vero spirito di dialogo e collaborazione. Vogliamo dare spazio ad altri, dialogare, ascoltare: l’obiettivo fondamentale dell’evento è l’incontro».