Giovanni Tummarello ha un curriculum abbastanza spiazzante: leggendo il numero di titoli accademici, pubblicazioni e di progetti cui ha partecipato o che ha ispirato, ci si aspetta di incontrare una sorta di ?grande vecchio? del Semantic Web, mentre invece si tratta di un trentenne pieno di idee, trasferitosi da poco in Irlanda per proseguire la sua attività di ricerca, e con un passato anche da programmatore di videogiochi per Amiga.
Alberto Brandolini – Ciao Giovanni, partiamo subito parlando di cosa ti stai occupando in questo momento
Giovanni Tummarello: molte cose. Forse una delle più interessanti dal punto di vista scientifico è il problema delle Entità , Identità ed Identificazione sul Semantic Web. E‘ un problema fondamentale e molto sentito da chi già utilizza queste tecnologie. L‘idea del Semantic Web e delle sue tecnologie e‘ infatti quella di poter “parlare”, in maniera comprensibile dalle macchine ovvero a simboli, di qualsiasi “cosa”. Ma come “chiamare” queste cose? Se si parla di una pagina web o di una risorsa che è comunque accessibile via web, viene naturale usare la sua URL, ma come chiamare un libro, una persona o il concetto di “Pace”? Concordare su un identificatore (URI) è l‘unico modo per poter fondere sorgenti di informazioni eterogenee sul (Semantic) Web.
Rispetto a qualche anno fa, dove andava per la maggiore la visione idealistica di “super decentralizzazione”, adesso il web 2.0 ed entità come Google hanno dimostrato che le cose funzionano benissimo anche centralizzate (anzi!). Il problema delle identità è certamente spinoso, per tante questioni. L‘obiettivo è, quindi, realizzare un sistema che riesca nel suo compito tecnico di fornire e o unificare gli identificatori rimanendo al tempo stesso “politicamente corretto” e neutrale.
Altro argomento di grande interesse e‘ come far si che le persone partecipino direttamente alla creazione di annotazioni sul Semantic Web. Web 2.0 e vari fenomeni associati suggeriscono modelli, ma come far si che sia veramente “interessante” per gli utenti finali creare annotazioni “semanticamente strutturate” ?
AB – Qual è lo stato attuale della ricerca sulle tecnologie semantiche? Quali sono le direttrici principali?
GT – Social Semantic Web e‘ certamente un argomento interessante ed affascinante. Ci sono vari progetti ed e‘ un focus importante qui all‘istituto dove lavoro attualmente (il Digital Enterprise Research Institute di Galway, in Irlanda n.d.r.).
Studi sull‘ uso della semantica in ambiente SOA (Semantic Web Services) sono di grande interesse pratico ed economico. C‘è ancora da fare però, soprattutto per mediare la naturale pulsione dell‘ “accademia” a creare cose troppo generiche ed infine complesse di contro a necessità più pragmatiche di deployment e creazione di valore tangibile proprie delle aziende.
Stiamo tutti aspettando poi con una certa trepidazione che si finalizzino tecnologie di base come un linguaggio di query per grafi RDF (SparQL). Ci si aspetta che questo dia un‘ulteriore impulso allo sviluppo di infrastrutture (ad esempio database) in grado di operare a livello enterprise.
AB – In precedenza ti sei occupato anche del progetto DBin, Di che si tratta? Come si colloca in questo scenario?
GT – DBin e‘ un progetto molto affascinante. Si tratta di un progetto ancora in corso, l‘idea di base e‘ una specie di EMule per annotazioni strutturate. In pratica uno entra in “gruppi” che parlando di certi argomenti, all–interno dei quali il proprio client può imparare cose riguardo a entità di interesse. Può trattarsi di qualsiasi cosa, non c‘è un argomento predefinito. E– possibile inserire conoscenza, apprendere quella degli altri, collaborare a crearla e rivederla. Una cosa molto interessante e‘ che questi gruppi presentano un–interfaccia utente specifica per il dominio scelto, e queste interfacce utenti, dette Brainlet, possono essere create in XML, senza programmazione. Far partire una “comunità di utenti” sul “semantic web” diviene facile come creare un file XML. Questa è la teoria almeno 🙂
AB – Quindi una sorta di combinazione tra tecnologie semantiche per la rappresentazione della conoscenza, un–interfaccia grafica che –si adattaâ? alla conoscenza che maneggia, ed un meccanismo di condivisione basato sul peer-to-peer. Qual‘è lo stato attuale delle cose sul DBin?
GT – La pratica è tutt‘altro che facile. Si tratta di un progetto complesso, si cui c–è ancora da lavorare prima di poterlo usare praticamente con costante soddisfazione. Il progetto è strettamente open source, comunque, e ci attendiamo che dopo le prime dimostrazioni di successo pratico ci sia poi essere un contributo diretto dalla comunità dei potenziali utenti.
AB – Qual è lo scenario per quanto riguarda le ricadute delle tecnologie semantiche in ambito applicativo? Quali sono i settori su cui c‘è più movimento?
GT – Beh, mettiamola cosi: chi ha avuto a che fare con un database RDF, in cui le tabelle sono sostituite da delle ontologie, difficilmente ha voglia di tornare indietro. Un database RDF diciamo che “si crea le tabelle da solo” quando arrivano nuovi dati che le richiedono. Questo genere di flessibilità richiede anche e certamente degli use cases appropriati, dei software che di questa libertà , in qualche modo, “sappiano che cosa farsene”. Ma non è difficile, con un po‘ di fantasia vedere possibili utilizzi, e queste applicazioni diventeranno sempre più comuni. Tra gli esempi che si possono riportare, esistono già dei sistemi Wiki basati su RDF che permettono agli utenti l‘immissione di dati strutturati in maniera abbastanza naturale ed infine forniscono API esterne per fare delle query sull‘ RDF risultate (per esempio –elenca le città con almeno x abitanti che fanno parte di una nazione in cui il PIL e‘ almeno etc…)
C‘è da dire, però, per essere realisti, che c‘è ancora molto da fare. I database attualmente disponibili come open source, ad esempio, non possono assolutamente sostituire quelli tradizionali in termini di scalabilità , velocità di esecuzione, robustezza e ricchezza di API e query language.
Gli studi sui Semantic Web Services porteranno probabilmente a qualcosa di molto interessante, in ambito enterprise, ad esempio un netto vantaggio per scenari applicativi di largo respiro, soprattutto nel caso in cui partecipino vari attori privi di necessariamente forti a priori (ad esempio negoziazione automatica di offerte da parte di vari web services, per trovare il più adatto e più conveniente).
AB – Cosa c‘è di attualmente disponibile sul mercato?
GT – Esistono dei buoni toolkits opensource per realizzare applicazioni semantic web, anche se spesso si occupano più di aspetti di base (storage delle informazioni in RDF, operatori per manipolarle, query language etc) che non funzionalità più avanzate, come interfaccia utente e modello di scambio su internet che sono ancora lasciati all‘implementatore finale. Pian pianino si arriverà a toolkit più comprensivi, un po‘ come DBin in un certo senso vuol diventare.
Esistono strumenti open source per la creazione di Ontologie ed anche per la popolazione di dati, Protege e‘ sicuramente il piu‘ noto.
Offerte commerciali sono presenti. Esiste un buon prodotto con una bella gui chiamato TopBraid composer, anche se dai costi di licenza difficilmente abbordabili. Altova ha un prodotto per Semantic Web (anche se di utilità limitata a mio avviso), Oracle ha una versione “semantica” del DB (10g, con supporto per SparQL). Esiste poi un buon numero di toolkits RDF commerciali, molti dei quali pubblicizzano scalabilità marcatamente superiore rispetto alle versioni Open Source.
Devo dire comunque che non sono personalmente troppo aggiornato sullo stato delle offerte commerciali in quanto il mio lavoro e‘ prevalentemente quello di cercare di .. “far partire il tutto” a livello globale, a volte si dice innescare il “net effect”. E perchè questo avvenga bisogna ancora inventarsi qualcosa probabilmente :-).
AB – E che cosa di nuovo?
GT – Beh, sono convinto che usare strumenti semantic web (RDF ad esempio) sia già oggi possibile e molto conveniente in scenari in cui è economicamente importante poter integrare rapidamente parti di conoscenza provenienti da diverse fonti in qualche modo, in semplice accordo (ad esempio, consorzio o associazione di aziende).
Ciò che però tutti noi che studiamo questa materia vorremmo vedere e‘ un semantic web fatto dalla gente ed usato quotidianamente e visibilmente così come è il web stesso.
Chiediamoci quindi, perchè lo stesso Mario Rossi che 10 anni fa si fece l‘homepage con l‘editor di testo, dovrebbe oggi voler creare annotazioni RDF. Una volta creata una homepage possiamo mandare il link agli amici via e-mail oppure, qualcuno può visitarla cercando il nome o, per esempio, attraverso un link su un profilo di un blog.
Se invece oggi egli scrivesse un file RDF che dice “http://mariorossi.example.org#ME -> espertoDi –> httpSemantic Web , http://mariorossi.example.org#ME –> espertoDi –> Musica Classica”, e lo linkasse dalla sua homepage.. che risultato avrebbe? Come gli sarebbe di vantaggio diretto, dato che un file RDF neanche si vede direttamente da un browser (e‘ un XML..)?
Si, ci sono primi rudimentali esempi di motori di ricerca semantic web (si veda http://swse.deri.ie ), Google stesso, prima o poi, potrebbe voler tenere in particolare conto queste affermazioni scritte in maniera cosi “esplicita”, ma si e‘ ancora lontani dal poter avere effetti diretti sull‘esperienza comune dell‘utente “internet”. In questo campo c‘è ancora da studiare… per esempio, si possono fare plugins di applicazioni popolari su web (Blogs, wikis etc) che rendano in qualche modo visibile il SW? 🙂 ideas welcome
Riferimenti
[1] Digital Enterprise Research Institute. http://deri.ie
[2] Il sito ufficiale di DBin. http://dbin.org
[3] Il sito ufficiale di Protegè. http://protege.stanford.edu
[4] Il sito ufficiale di TopBraid Composer: http://www.topbraidcomposer.com
[5] Il sito ufficiale di Alcova SemanticWorks: http://www.altova.com/products/semanticworks/semantic_web_rdf_owl_editor.html
[6] Semantic Technologies Center di Oracle. http://www.oracle.com/technology/tech/semantic_technologies/index.html
[7] Semantic Web Search Engine presso il D.E.R.I. http://swse.deri.org/
[8] Semantic Web e Multimedia Group. D.E.I.T. – Università Politecnica delle Marche – Ancona. http://semanticweb.deit.univpm.it/tiki-index.php?page=ProjectProposalPage
[9] Semantic Web Application and Perspective Workshop series. http://www.swapconf.it
[10] Il sito ufficiale di Sensibile Logic http://www.sensiblelogic.com
L‘ing. Giovanni Tummarello, e‘ dottore di ricerca con specializzazione in Semantic Web e Metadati Multimediali. Attalmente lavora come PostDoctoral Researcher presso il Digital Enterprise Research Institute (http://deri.ie) a Galway, in Irlanda. È ideatore della serie di conferenze SWAP, Semantic Web Applications and Perspective (www.swapconf.it) con edizioni 2004 (Ancona), 2005 (Trento), 2006 (Pisa), 2007 (Roma). È inoltre CEO di Sensible Logic, compagnia di consulenza e sviluppo prodotti Semantic Web.
La sua home page personale è consultabile presso l‘indirizzo http://g1o.net