Nel precedente articolo è stata fornita un‘introduzione all‘ambiente di Document Warehousing, illustrando l‘architettura di sistema e la descrizione del ciclo di vita del Document Warehouse. Il secondo articolo della miniserie descrive un case-study relativo al dominio dell‘Health Management per sistemi aerospaziali, nell‘ambito del quale è stato realizzato un prototipo di sistema di Document Warehousing basato su tool open source.
Con il primo articolo di questa miniserie, affrontiamo la tematica del Document Warehousing, ossia l‘analisi multidimensionale applicata a sorgenti testuali. In qualunque organizzazione, gran parte dell‘informazione è racchiusa in documenti non strutturati: il Document Warehousing serve proprio di trarre informazioni dalla grande mole di dati non strutturati presente nei documenti testuali.
Il primo articolo della serie ha rappresentato una introduzione al mondo dei Data WareHouse; con questa seconda parte, vediamo alcune tecnologie abilitanti affrontando una analisi dei prodotti open source attualmente presenti sul mercato che sono a supporto della Business Intelligence: Pentaho, SpagoBI e JasperForge.