In due casi di esempio, vengono analizzate le attuali possibilità di applicazione reale del Semantic Web. Sebbene il Semantic Web necessiti ancora di ulteriori soluzioni pratiche e teoriche prima di raggiungere la maturità, si possono comunque prevedere interessantissimi sviluppi.
Il contesto: la Network of Excellence “KNOWLEDGEWEB”
I lavori descritti in questo articolo fanno parte di una serie di attività organizzate da Knowledgeweb” (http://knowledgeweb.semanticweb.org), una rete di eccellenza finanziata dal 6ð programma quadro europeo. Tale progetto ha durata di 4 anni e, attraverso la collaborazione di 18 partner iniziali (università ed enti di ricerca), ha l‘obiettivo di studiare il semantic web sia nelle sue basi scientifiche, sia come processo di trasferimento tecnologico al mondo industriale. In particolare, una parte del progetto, chiamata “Outreach to Industry” (http://knowledgeweb.semanticweb.org/o2i/), ha l‘obiettivo di attivare un canale di comunicazione preferenziale con imprenditori e aziende allo scopo di favorire la diffusione delle tecnologie semantiche nelle imprese e di acquisire, dai casi di studio, degli indirizzi innovativi alla ricerca di base.
Nel corso del progetto si è costituito e rinforzato un gruppo di imprese che collaborano con i ricercatori del network e che attraverso il portale accedono ai risultati della ricerca. Oggi il board industriale conta 47 aziende europee, nei settori delle soluzioni tecnologiche, delle telecomunicazioni, dei media e della comunicazione, della salute, della consulenza, dell‘energia, dei trasporti, ecc.
In questo articolo si vogliono descrivere due dei casi di studio suggeriti dal board industriale, ponendo una forte enfasi su come alcune tecnologie di semantic web possono migliorare i servizi già esistenti. Siamo comunque consapevoli che la tecnologia è in continua evoluzione e abbisogna ancora di ulteriori soluzioni pratiche e teoriche, oggi oggetto di studio. A tale proposito è interessante citare il fatto che ad ognuno dei casi del progetto sono state affiancate delle attività di ricerca che hanno l‘obiettivo di risolvere alcuni problemi quali:
- Risolvere l‘accuratezza nelle fasi di retrieval e la rilevanza dei processi di approssimazione nelle query semantiche. A queste attività hanno partecipare ricercatori dell‘area di progetto “scalability” e il partner industriale WorldWideJobs GmbH.
- Migliorare i processi di alignment di modelli di rappresentazione della conoscenza eterogenei. A queste attività hanno partecipato alcuni ricercatori dell‘area di progetto “heterogenity” e il partner industriale Hewlett Packard.
- Sviluppare sistemi di integrazione dinamica B2B. A queste attività hanno partecipato alcuni ricercatori dell‘area “semantic web services” e il partner industriale Bell Labs.
- Integrazione di dati e supporto alle decisioni in ambito sanitario (dialisi e trapianti). A queste attività hanno partecipato alcuni ricercatori dell‘area di progetto “semantic web language extensions” e il partner industriale Institut de Biomedicine.
- Analisi e annotazione dei contenuti multimediali. Hanno partecipato il partner di progetto CERTH e il partner industriale Motorola.
Nei successivi casi di studio si descrivono le motivazioni principali che spingono le imprese e i ricercatori ad individuare soluzioni innovative di semantic web e, a supporto delle tesi trattate, si rimanda il lettore a documenti, articoli e prototipi disponibili on line.
Il primo caso di studio: la riduzione dei costi sugli acquisti grazie a sistemi basati sulla semantica
Gli acquisti dei prodotti si basano tradizionalmente su un rapporto fiduciario tra le aziende e i loro fornitori. Spesso per i beni non core (non strategici per l‘azienda) non si ricorrere a nessun tipo di valutazione o pianificazione della spesa, si utilizzano procedure di fornitura obsolete e si acquistano prodotti e servizi tradizionali senza analizzare l‘esistenza di prodotti complementari che siano allo stesso tempo tecnologicamente più innovativi e meno costosi. Sebbene questi prodotti sono tipicamente poco incidenti sul totale della spesa, per imprese di grosse dimensioni corrispondono a cifre consistenti in milioni di euro. Le imprese, quindi, hanno cominciato a sviluppare strumenti tecnologici che fornissero servizi di comparazione dei prezzi e dei prodotti e che, allo stesso tempo, potessero essere integrati nei processi di acquisto. Alcune delle aziende che offrono questi servizi e strumenti sono:
- Ariba (www.ariba.com) mette a disposizione dei propri clienti una rosa di esperti di dominio, servizi operativi e soluzioni tecnologiche personalizzate che accelerano e facilitano i compiti quotidiani e un‘effettiva gestione della spesa.
- Zycus (www.zycus.com) è considerato dai maggiori analisti del mercato come un pioniere nel campo dello “spend data management” adottando tecniche automatiche di classificazione dei listini e dei dati di spesa basate su metodi euristici (in particolare bayesiani).
- Requisite Technology (http://www.requisite.com) aiuta le grandi organizzazioni a trasformare dati, precedentemente non utilizzabili, in informazioni consolidate, organizzate, ricercabili e visibili all‘interno di tutta l‘azienda.
I sistemi di “spend data management” vengono impiegati solitamente per analizzare i prodotti e i servizi acquistati, allo scopo di crearne un modello di consumo, vale a dire un insieme di voci che descrivono le tipologie dei prodotti acquistati, le loro quantità e i prezzi medi. In altre parole, i confronti avvengono solitamente sulla base di un unico sistema tassonomico che classifica ogni prodotto e servizio ad esso riferito. Ne deriva che, quando un nuovo prodotto viene distribuito nel mercato, occorre riferire il prodotto al sistema tassonomico precedentemente costruito e solo successivamente può essere comparato con altri prodotti funzionalmente equivalenti (succedanei e/o sostitutivi) già presenti nel sistema. Non si tratta quindi di una vera negoziazione semantica tra voci di prodotti o servizi che, pur avendo nomi differenti ed essendo forniti da soggetti diversi, sono simili per funzionalità e caratteristiche tecniche.
La semantica viene usata in particolare da uno strumento creato da Creactive Consulting S.p.A. (http://www.creactive-consulting.com/, una azienda di consulenza veronese) allo scopo di supportare il confronto tra cataloghi di fornitori diversi e l‘individuazione del prodotto che, a parità di caratteristiche tecniche, costa di meno. Esso è formato da due componenti principali: Creactive SSPCatalog (Self Service Procurement Catalog) e Creactive Semantic Search. Rispettivamente hanno il compito di integrare (analizzando e generando dei processi di semantic matching) voci simili di cataloghi diversi e hanno il compito di supportare l‘ufficio acquisti nella ricerca e nella selezione del prodotto che costa meno tra quelli offerti dai soggetti che con l‘azienda hanno rapporti di fornitura. In particolare Creactive SSPCatalog gestisce una base di dati che conserva in modo coerente ed integrato le informazioni sui cataloghi dei prodotti di tutti i fornitori, le politiche concordate con i fornitori stessi per la definizione dei prezzi (“listini”) e la politica globale dell‘azienda acquirente circa i prodotti che è possibile acquistare (“modello di acquisto”).
Come descritto in Figura 1 l‘acquirente può semplicemente navigare il catalogo e ricercare il prodotto che desidera. In modo automatico vengono suggerite le sotto-categorie del prodotto desiderato, fino ad arrivare ai beni che possono essere ordinati. I prodotti proposti saranno quelli che, a parità di caratteristiche tecniche e funzionali, hanno il costo di acquisto minore. Creactive Semantic Serach permette agli acquirenti di cercare, all‘interno della base di dati, un prodotto o un servizio specifico che corrisponda alle esigenze dell‘acquirente, ma che allo stesso tempo soddisfi il modello di acquisto dell‘azienda. Semantic Search può interfacciarsi con archivi di terze parti già operativi, fornendo una funzione di mediazione tra il linguaggio naturale dipendente dal contesto dell‘utente e le interfacce di ricerca strutturata delle suite ERP tradizionali.
Il secondo caso di studio: un sistema di reclutamento basato sul semantic web
Questo caso di studio è parte integrante del progetto “KnowledgeNets” (http://wissensnetze.ag-nbi.de/) coordinato dalla Freie Università¤t di Berlino.
La ricerca, la selezione e l‘assunzione dei lavoratori si sta spostando dai tradizionali sistemi pubblicistici come giornali, fiere commerciali e aziende di consulenza, a Internet. Basti pensare che nei prossimi anni le attività di reclutamento on line in alcuni Paesi europei si attesterà intorno al 50% dei processi di reclutamento tradizionali. I servizi supportati dall‘ICT sono vari ed eventuali e possono riguardare siti web delle aziende attraverso i quali si pubblicano le offerte di lavoro, siti pubblici dove si inseriscono le offerte di lavoro e si possono consultare le liste di collocamento (ad esempio il German Federal Employment Office, lo Swedish National Labour Market Administration), portali dedicati alla ricerca e all‘offerta di lavoro (ad esempio Monster e Jobpilot), ecc. Ognuna di queste soluzioni ha favorito una sensibile riduzione dei costi (in termini di tempo e denaro speso) a fronte di una maggiore efficacia del servizio di reclutamento.
Il tradizionale processo di reclutamento on line si attiva nel momento in cui una aziende pone degli annunci di offerte sul proprio sito aziendale (o su altri siti specializzati) e gli interessati scrivono una e-mail o mandano una lettera con il proprio curriculum. A quel punto l‘azienda sceglie il candidato migliore tra un numero variabile di proposte. Oggi l‘utilizzo di siti web intermediari rendono più efficiente il processo, forniscono uno o più archivi on line per la raccolta delle richieste e delle offerte di lavoro e rendono più veloci i processi di scelta dei candidati.
Uno dei requisiti fondamentali è la comparabilità dei dati che descrivono sia l‘offerta lavorativa sia le conoscenze, le competenze e gli interessi del lavoratore che cerca una occupazione. Da una parte l‘azienda ha bisogno di descrivere le mansioni aziendali, il ruolo organizzativo che ricopre, gli eventuali benefit e la tipologia di contratto, dall‘altra il lavoratore presenta il proprio curriculum descrivendo le proprie attitudini personali, le attività lavorative pregresse (con l‘indicazione delle aziende in cui ha già lavorato), i propri dati personali. Tipicamente questi dati rispecchiano due prospettive tra loro opposte che fanno riferimento a bisogni specifici dell‘azienda e dei lavoratori, i dati quindi non sono descritti con uno stesso linguaggio e difficilmente sono direttamente confrontabili nel loro significato. Inoltre, i lavoratori inseriscono informazioni non complete e poco consistenti. Tutto questo rende difficile sviluppare delle operazioni automatiche di elaborazione e confronto dei dati che i diversi soggetti inseriscono.
Il modo tradizionale con il quale si è cercato di superare il problema è quello di strutturare tali informazioni in categorie complesse, scrivere del testo in linguaggio naturale, utilizzare il supporto di tag XML o meglio ancora HR XML (una estensione dello standard XML per le risorse umane), RDF o OWL.
Permane comunque la difficoltà nel confrontare informazioni che per loro natura hanno dei significati semantici diversi. Nel corso del 2006 sono state implementate alcune soluzioni quali RDF API per PHP (un software package per il parsing, la ricerca, e la manipolazione di modelli RDF), D2R MAP (un linguaggio dichiarativo che descrive il mapping tra schemi di database relazionaliÃÂ e ontologie in OWL/RDFS)
Conclusioni
Con la descrizione di questi due casi di studio si vuole sottolineare il fatto che le imprese e gli istituti di ricerca stanno supportando uno sforzo congiunto nell‘integrare conoscenze tecniche e bisogni organizzativi per sviluppare e implementare con successo alcune soluzioni di semantic web.
Si è deciso volutamente di non focalizzare l‘attenzione su alcune innovazioni tecniche, comunque disponibili in articoli scientifici, prototipi e deliverable di progetto nei siti web di riferimento indicati.
L‘autrice ringrazia gli autori Lyndon Nixon e Malgorzata Mochol per la loro ampia disponibilità nel fornire i dati oggetto di analisi in questo articolo.
Riferimenti
Cuel R., “Knowledge based methods in reduction cost processes” Cap. 11. In: KnowledgeBoard‘s first Book and eBook. Kazi A.S. and Wolf P. (Editor of) Real-Life Knowledge Management. Lesson from the Field. Finland 2006. ISBN 9525004724
Cuel R., Bellomi F., Biscaro R., Collini P., “Brokers on cost management make use of knowledge based practices and ontology based tools”. In: Proceedings of 22nd Industrial Marketing and Purchasing Group Conference. Milan (Italy), 7-9 September, 2006.
Bellomi F., Cuel R., Biscaro R., “Ontology Driven Text Mining for Cost Management Processes”. Editors: Bouquet P. and Tummarello G. In: CEUR Workshop Proceedings “SWAP 2005, Semantic Web Applications and Perspectives”. ISSN 1613-0073. Trento (Italy), December 14-16, 2005.
Institut fà¼r Wirtschaftsinformatik der Johann Wolfgang Goethe-Università¤t Frankfurt am Main, Monster Deutschland & TMP Worldwide: Recruiting Trends 2004 (2003), 2. Fachsymposiums fà¼r Personalverantwortliche.
Billig, A., Sandkuhl, K.: “Match-Making based on Semantic Nets: the XML-based approach of BaSeWeb”. In Tolksdorf, R., Eckstein, R., eds: Proceedings of the 1st Workshop on XML Technologies for the Semantic Web. (2002) 39-51.
Sven Herschel, Ralf Heese, Jens Bleiholder, An Architecture for Emergent Semantics, International Workshop on Semantic Web Applications: Theory and Practice at ER 2006, USA, November 2006.
Malgorzata Mochol, Elena Paslaru Bontas Simperl, “A high-level Architecture of Metadata-based Ontology Matching (MOMA) Framework”, 5th International Workshop on Web Semantics (WebS ‘06) at DEXA‘06, Poland, September 2006.