Sta per partire a Torino la seconda edizione di Big Dive, il programma di formazione per Data Scientist, ovvero le figure professionali multidisciplinari che operano nel settore dei big data. E' l'occasione per vedere quali sono stati i risultati della prima edizione e, in particolare, i lavori realizzati dai partecipanti, per comprendere meglio quali possono essere i campi di applicazione, i dataset e le tecnologie utilizzabili dei professionisti.
Un training internazionale e interdisciplinare
Innanzitutto fin dal primo anno Big Dive si è posto in una prospettiva internazionale e, ovviamente, multidisciplinare. L'offerta formativa delle 4 settimane della prima edizione (1-26 Ottobre 2012) di training è stata strutturata in 3 percorsi di studi interdisciplinari organizzati da altrettante realtà operanti nel territorio piemontese:
1) Development, coordinato dalla società di sviluppo software Axant;
2) Visualization, coordinato dallo studio di interaction design ToDo ;
3) Data Science, coordinato dalla Fondazione ISI.
La formazione di alto livello in lingua inglese (94 ore di lezione diretta con 25 speaker internazionali) ha attirato partecipanti da 8 nazioni (Italia, Svizzera, Irlanda, Polonia, Germania, Stati Uniti, Brasile, Iran).
Oltre alle lezioni dedicate ai 20 partecipanti selezionati si sono svolti anche 3 eventi aperti al pubblico, dedicati alla Data Science, agli aspetti economici e legali dei big data e alle tecniche di visualizzazione con l'editor di visualisingdata.com Andy Kirk.
Per i partecipanti il training è stata un'occasione per mettersi alla prova e fare networking:
The informal atmosphere ('hacking' not 'hi-school'), especially with style 'OK, so show us what you can do with that tools' was great.
Anyway it has been a good course and an overall great experience too (also in terms of networking).
Thanks you all for organizing it - god knows how we need such initiatives here in Italy.
Trovare lavoro nel campo dei big data
Da non dimenticare però l'obiettivo principale del training, ovvero formare professionisti che possano avere interessanti opportunità lavorative.
Poche settimane dopo la conclusione di Big Dive molti dei partecipanti hanno messo a frutto l'esperienza in ambito professionale. Ad esempio Irene Laino è stata assunta da Voxpro, un’azienda che lavora nell’analisi dei Big Data; Claudio Martines ha consolidato la sua startup AutomApp, un’applicazione che organizza le attività personali dell’utente sull’osservazione delle sue abitudini e del suo comportamento; infine Luca Bonavita lavora su progetti di visualizzazione dei dati.
Lavori finali presentati alla prima edizione di Big Dive
Vediamo alcuni dei lavori realizzati dagli studenti che hanno partecipato alla prima edizione.
TAG GRAPH MAP OF STACK EXCHANGE
Piotr Migdal ha realizzato un grafico che mappa i 256 tag più utilizzati presenti all'interno dei siti della rete StackExchange (la piattaforma collaborativa di Q&A), in particolar modo di StackOverFlow.
Utilizzando query da SE Data Explorer e chiamate alle API sono stati estrapolati i tag, i quali, attraverso un algoritmo generato con Gephi (la piattaforma open source di che consente la visualizzazione di grafi), sono stati suddivisi in macrocategorie a cui è stato assegnato un determinato colore.
Oltre a mostrare le relazioni che intercorrono tra loro, il grafico utilizza differenti dimensioni dei nodi per rappresentare la popolarità di tali termini all'interno dei siti analizzati.
OPEN STREET MAP GPS POINT DATA VISUALIZATION
Luca Bonavita, Marcello Pietri, Roberto Piuca e Paolo Viotti hanno realizzato una visualizzazione che mostra le differenti densità dei punti GPS registrati sulla superficie terrestre.
Il set di dati utilizzato è rilasciato da OpenStreetMap, mentre per realizzare la mappa sono stati utilizzati immagini rilasciate da thematicmapping.org e NASA. Infine per la tecnologia sono stati utilizzati Python, Amazon Elastic Map Reduce e Amazon Simple Storage Service.
IF A TWEET WAS A LIGHTING POLE
Marcelo Serrano Zanetti ha realizzato un'istantanea della superficie mondiale "illuminata" a seconda della presenza di tweet sul territorio. La rappresentazione è stata creata utilizzando interamente codice Javascipt.
MIDDLE EAST TWITTER WORDCLOUD
Ciara Byrne e Fariba Karimi hanno realizzato una rappresentazione delle parole più utilizzate dagli utenti di Twitter in Medio Oriente nelle giornate successive alle dimissioni di Hosni Mubarak da presidente dell'Egitto (11 febbraio 2011). Le dimensioni del carattere utilizzato indicano il peso e la presenza che tale parola ha avuto durante l'intero giorno.
Interessante il caso del 15 febbraio 2011, la cui frase dominante su Twitter è stata "TheGuyBehindOmarSuleiman", riferendosi all'uomo che è apparso dietro al vicepresidente egiziano durante i suoi discorsi in diretta televisiva e che improvvisamente ha "ossessionato" tutta la regione.
La seconda edizione al via il 3 giugno 2013
Se siete dunque interessati alle opportunità di professionalizzazione del corso, fino al 19 Maggio sono aperte le iscrizioni della seconda edizione che partirà il 3 giugno, per 5 settimane di intenso hacking.