http://www.cnr.it/ontology/cnr/individuo/descrizionemodulo-descrizionemodulo/ID7689
Descrizione del modulo "Social and Semantic Web (ICT.P08.017.001)"
- Type
- Label
- Descrizione del modulo "Social and Semantic Web (ICT.P08.017.001)" (literal)
- Potenziale impiego per bisogni individuali e collettivi
- I principali impieghi per bisogni individuali e collettivi derivanti dal lavoro in questo modulo si hanno nel settore del turismo, della valorizzazione del patrimonio culturale, nella sperimentazione di nuovi modi di educazione e nella informatizzazione delle Pubbliche Amministrazioni. (literal)
- Tematiche di ricerca
- Le principali attività di questo modulo riguardano tematiche di Web of Data, Open Source Intelligence, Information Visualization, Digital Humanities Infrastructure e Data Journalism.
In particolare verranno studiati metodi per misuare la qualità dei dati provenienti dai social media, per integrare dati geografici provenienti da sorgenti eterogenee, per navigare LD dataset, per la valutazione di tecniche di visualizzazione, per la visualizzazione cartografica di dati non geografici, per l'editing collaborativo di contenuto multimediale su web e per la creazione di web digital story telling. (literal)
- Competenze
- Le principali competenze possedute all'interno del modulo riguardano tecniche di web harvesting tramite scraping e web api, data cleaning, data matching e data fusion, inoltre conoscenze nella definizione di query sparql, nella costruzione di nodi linked data, nell'utilizzo di librerie di data visualization. (literal)
- Potenziale impiego per processi produttivi
- I risultati di questo modulo sono utilizzati nei processi produttivi di contenuto in particolare in moduli di digital storytelling e infografiche. Altro potenziale impiego dei risultati di questo modulo è stato nella realizzazione di sistemi a supporto delle decisioni, e in generale di intelligence. (literal)
- Tecnologie
- Le tecnologie utilizzate sono tutte quelle inerenti l'estrazione, l'analisi semantica e la visualizzazione di dati provenienti da web. Per lo storage dei dati si utilizano database a grafi, rdf (virtuoso) non relazionali (mongo DB) e relazionali (Mysql).
L'analisi e l'estrazione dei dati verrà effettuata con linguaggi di scripting come PHP e Python, per l'interrogazione si fa uso di SQL, SPARQL, per la classificazione semantica si utilizzano le ontologie standard come Dublin Core, vCard, GeoNames, DbPedia, mentre per quanto riguarda la visualizzazione si utilizzano tecnologie web come HTML5, CSS3 e Javascript.
In particolare verranno utilizzate alcune librerie javascript come JQuery, HighChart e D3.
Molte attività del modulo richiedono l'implementazione di prototipi, esse sono affrontate con tecniche dette \"agile software development\". (literal)
- Obiettivi
- Sfruttare le potenzialità del web sia dal punto dell'acquisizione, analisi e visualizzazione dei dati già presenti sia nella creazione di particolari applicazioni web per la creazione di nuovo contenuto. (literal)
- Stato dell'arte
- La visione molto futuristica sul Semantic Web, nasce con un articolo del 2001 di Tim Berners Lee su Science. Dopo aver definito tutta una serie di tecnologie e sviluppato una serie di tool ha diretto le sue ricerche (2007) su obiettivi applicativi che portano verso la creazione di un Web di dati (Web of Data), parallelo al web classico (Web of Documents). Questo Web of data, che sarà ad uso e consumo di agenti software, ha l'obiettivo di mettere a condivisione i dati memorizzati in DB distinti, creando una ragnatela di collegamenti analoga alla ragnatela del web che conosciamo. A questo fine risultano molto interessanti le iniziative legate alla pubblicazione degli Open Data, in particolare quelli governativi, e il progetto Linked Data. Le due iniziative prendono anche il nome congiunto \"Linked Open Data\". Le sfide principali dei \"Linked Open Data\" sono i passi di integrazione di dati di sorgenti diverse e lo sviluppo di applicazioni che sappiano interpretare questi dati definiti in modo distribuito ovvero senza un organismo centrale. Ancora oggi mancano strumenti validi per navigare e visualizzare questa ragnatela di dataset. (literal)
- Tecniche di indagine
- Per l'harvesting dei dati si utilizzano tecniche basate su algoritmi ricorsivi. Per la data integration si utilizzano tecniche di indicizzamento, comparazione di stringhe, comparazione di distanze geografiche, classificazione. Per la costruzione di nodi linked data, si utilizzano tecniche di wikification.
Per fare questo tipo di elaborazioni oltre alla normale dotazione di notebook si utilizzerà la potenza di calcolo fornita da una piccola farm composta da 4 server fisici sopra i quali sono state virtualizzate per ogni progetto 1 o più macchine. (literal)
- Descrizione di
Incoming links:
- Descrizione