Descrizione della commessa "Digital Libraries (ICT.P08.010)"

Type
Label
  • Descrizione della commessa "Digital Libraries (ICT.P08.010)" (literal)
Potenziale impiego per bisogni individuali e collettivi
  • Un importante area di impiego delle tecnologie sviluppate dalla ricerca su Digital Libraries è la realizzazione di strumenti per la gestione integrata di biblioteche tradizionali e digitali: POLAR, un prototipo di Biblioteca Digitale per la Scienza e la Tecnica, è stato pensato per il personale di ricerca delle strutture del CNR e per chi si occupa della gestione di una Biblioteca. Consiste nella realizzazione di un portale che riunisce i diversi aspetti della documentazione scientifica. Offre ai ricercatori un punto di accesso facilitato per la ricerca di documentazione scientifica necessaria per il proprio aggiornamento professionale. PUMA è un'infrastruttura software per la gestione degli archivi istituzionali e/o disciplinari della letteratura pubblicata degli Istituti CNR. L'idea è nata dall'esigenza di realizzare un ciclo completo dell'informazione che permetta di realizzare servizi diversi rispondendo alle seguenti necessità: a) rendere i risultati della produzione intellettuale accessibili alla comunità scientifica nel più breve tempo possibile; b) conservare i documenti in formato digitale in sostituzione della versione cartacea; c) creare repertori bibliografici. (literal)
Strumentazione
  • La strumentazione nel laboratorio della commessa consiste di circa 100 macchine fra laptop e desktop, di cui 8 sono utilizzate come server attività comuni del laboratorio (web con siti di progetto e personali, file server) o per progetti specifici (server di sviluppo, test, demo, software repository). Inoltre vi sono circa 60 server di varie fasce dislocati nella sala macchine dell'ISTI, edificio A, per realizzare le infrastrutture per la sperimentazione, lo sviluppo e l'operatività dei progetti. Questi sono server Sun, Intel, Supermicro e Dell, con processori Intel Xeon e Amd Opteron, con architettura multicore e dischi ridondati e istallati in rack e con apparati di networking e UPS dedicati. Fra questi vi sono storage server, con circa 160 TB di spazio disco, su parte dei quali risiedono i dati e le features delle immagini per la test collection Cophir. La quasi totalità sono basati su SO Linux (Debian, Ubuntu, Centos, Scientific Linux), con alcune macchine Windows e 2003 Server. Parte di questi supportano le infrastrutture per i progetti. (literal)
Tematiche di ricerca
  • Le principali tematiche sono: Multimedia Similarity Search - metodi di accesso distribuiti per la ricerca basata sulla similarità visuale; - ricerca su scala Web di immagini od oggetti in immagini. Automatic text and image categorization - generazione automatica di classificatori di testo e immagini; - riconoscimento automatico del contenuto di immagini (oggetti contenuti); - applicazioni della classificazione automatica alla comprensione del contenuto di testi: codifica automatica di sondaggi, analisi di opinioni, etc. Data Management in Wireless Sensor Networks - Esecuzione di ricerche di dati in Reti di Sensori applicando il paradigma database; - sviluppo di cyber-physical systems Ontology management - framework logico-probabilistico per la rappresentazione di conoscenza incerta; - allineamento automatico di diverse ontologie Digital Library Infrastructures and Services - sviluppo di infrastrutture dati di enormi dimensioni (Big Data), adatte a dati scientifici (da satelliti, sensori, etc.); - gestione di biblioteche digitali e dei loro portali per applicazioni ai beni culturali - accesso all'informazione bibliografica (literal)
Competenze
  • Le competenze di base provengono dalle seguenti aree scientifiche: Basi di Dati, Information Retrieval, Ricerca, estrazione e gestione di contenuti multimediali, Rappresentazione della conoscenza, Apprendimento automatico, cyber-physical systems. Su queste conoscenze di base, si sono sviluppate, e vengono continuamente approfondite, le tecnologie e le tecniche di indagine, sia a livello di ricerca che a livello sperimentale, riguardanti le Digital Libraries e le infrastrutture dati di grandi dimensioni in genere. Ciò ha lo scopo di sviluppare nuovi strumenti e infrastrutture di supporto, per l'accesso, la gestione, la conservazione, l'arricchimento e la disseminazione di contenuti informativi testuali e multimediali distribuiti. (literal)
Potenziale impiego per processi produttivi
  • I risultati delle attività di ricerca svolte e supportati da vari progetti con finanziamenti esterni, hanno portato alla realizzazione di prototipi integrati che hanno un potenziale impiego in diversi settori applicativi. In particolare, un potenziale impiego per processi produttivi possono avere il sistema MILOS per applicazioni di gestione di contenuti multimediali, i sistemi OpenDLib e DRIVER, per applicazioni di biblioteche digitali e il sistema VCS per la classificazione di testi. La tecnologia MILOS ha possibili applicazioni nel campo dell'editoria, broadcasting, gestione di documentazione multimediale (immagini, audio/video, testi associati) e composita in ambito industriale e educativo (applicazioni e-Learning). La tecnologia OpenDLib e DRIVER ha applicazione nella gestione documentale in ambito sia industriale che della pubblica amministrazione, istituzioni di ricerca e di salvaguardia del patrimonio culturale, e nella realizzazione di servizi associati. La tecnologia VCS (Verbatim Classification System) permette di analizzare le opinioni, scritte senza vincoli di schemi o scelte preconfezionate, classificando in modo automatico il parere espresso. (literal)
Tecnologie
  • La ricerca portata avanti, indirizzata allo sviluppo di nuovi sistemi di gestione di Digital Libraries e di infrastrutture dati in generale, si basa su queste tecnologie: - Big Data infrastructures - Information discovery and retrieval - Information interpretation and management - Similarity search on multimedia content - Information extraction from textual and multimedia content - Indexing of multimedia content - Digital preservation - Cyber-physical systems - Ontology-driven networked multimedia information access (literal)
Obiettivi
  • Obbiettivi di ricerca sono: - tecnologie di supporto di un ambiente distribuito per servizi di Digital Libraries dinamiche (Dynamic data infrastructures); - tecnologie per le infrastrutture dati che supportino computazioni intensive sui dati stessi, soprattutto di natura scientifica (Big Data Challenge); - tecniche per la gestione distribuita di dati su reti di sensori e lo sviluppo di cyber-physical systems - modelli per la rappresentazione di informazione multimediale e dei relativi metadati, strutture dati e metodi per l'esecuzione efficiente di interrogazioni su dati multimediali su larga scala; - tecniche di classificazione automatica di immagini e loro applicazione nel filtraggio di immagini indesiderate (e.g. immagini pornografiche); - applicazione delle tecniche di classificazione automatica dei testi alla codifica automatica di sondaggi e alla generazione automatica di dizionari tematici; - tecniche automatiche per l'accesso a dati annotati semanticamente secondo una o più ontologie, e per l'integrazione e allineamento di ontologie distribuite su Web. - tecniche, tecnologie e pratiche per la Digital Preservation con particolare riguardo al settore dei beni culturali (literal)
Stato dell'arte
  • Il termine \"Digital Library\" fa riferimento a sistemi di natura molto eterogenea e con funzionalità molto diverse: dagli archivi di oggetti digitali e metadati ai sistemi più complessi che integrano i servizi più avanzati, spesso ancora a livello di ricerca. Attualmente il termine Digital Libraries viene esteso per comprendere tutto il più vasto settore delle \"Digital Data Infrastructures\", in particolare nella nuova prospettiva introdotta col crescente interesse per i Big Data. Alcuni membri della commessa hanno partecipato all'Expert Group on Big Data Analytics producendo un White Paper \"Big Data Analytics: towards a European research agenda\" in cui si identificano le direzioni di sviluppo della ricerca: - sviluppo di nuove fondazioni basate sull'integrazione di knowledge discovery, modellazione statistica e sistemi complessi - tecnologie semantiche di integrazione e arricchimento dei dati - tecnologie scalabili e distribuite per gestire gli enormi flussi di Big Data (soprattutto in caso di streaming) (literal)
Tecniche di indagine
  • Sono state sviluppate tecniche di indagine strutturate per i quattro diversi ruoli individuati per l'interazione con le Digital Libraries: - DL End-Users. Intendono sfruttare le funzionalità delle Digital Libraries per provvedere, usare e gestire i loro contenuti. - DL Designers. Intendono sfruttare la conoscenza del dominio semantico delle applicazioni, per definire e mantenere le Digital Libraries in modo da allinearle con le informazioni e le necessità funzionali degli utenti finali. - DL System Administrators. Selezionano le componenti software necessarie per creare i sistemi per Digital Libraries più adatti per le applicazioni richieste e decidere dove e come effettuare il deployment (messa in opera). - DL Application Developers. Sviluppano le componenti software dei sistemi per Digital Libraries. (literal)
Descrizione di

Incoming links:


Descrizione
data.CNR.it