http://www.cnr.it/ontology/cnr/individuo/descrizionecommessa-descrizionecommessa/ID1385
Descrizione della commessa "Gestire, Estrarre Conoscenza e Ragionare sui Dati (ICT.P08.002)"
- Type
- Label
- Descrizione della commessa "Gestire, Estrarre Conoscenza e Ragionare sui Dati (ICT.P08.002)" (literal)
- Potenziale impiego per bisogni individuali e collettivi
- Il settore ICT è considerato come il settore chiave per la
società della conoscenza, in quanto cruciale per la competitività
europea, lo sviluppo industriale e l'impatto sui servizi e la qualità di
vita. Le \"tecnologie basate sulla conoscenza\", anche dette \"tecnologie
intelligenti\", e tra queste quelle di estrazione della conoscenza e delle
buone pratice di comportamento giocheranno un ruolo sempre maggiore
all'interno del settore ICT nella modernizzazione della nostra società,
nello sviluppo di nuovi prodotti e servizi al cittadino. Un modulo della
commessa ha come obiettivo specifico contribuire all'elaborazione di
modelli per una più efficace erogazione dei servizi sanitari. (literal)
- Strumentazione
- La strumentazione a disposizione dei ricercatori partecipanti alla commessa consiste in una serie personal computer e ambienti e strumenti integrati di sviluppo di applicazioni. In aggiunta, si hanno a disposizione diversi cluster di computers ad alte prestazioni presenti presso le sedi di Cosenza, Napoli e Palermo. (literal)
- Tematiche di ricerca
- La grande quantità e diversità di dati oggi disponibili introduce seri
problemi per la loro rappresentazione e gestione. Le tecniche
tradizionali di gestione e analisi dei dati sono inadatte ai contesti
applicativi emergenti e predominanti,quali Web,business process
modeling,bioinformatica. La commessa si concentra sulle tematiche di
ricerca connesse all'analisi, all'estrazione di conoscenza e alla
gestione dei dati generati da questi nuovi scenari applicativi. In
particolare l'interesse è sui seguenti temi:1)Tipi differenti di
dati.Accanto ai classici dati numerici/categorici/simbolici,si
considerano dati complessi(grafi,alberi,sequenze,testi,ad alta
dimensionalità).
2) Flussi continui e distribuiti.I dati possono provenire da sorgenti
distribuite ed eterogenee,quali documenti testuali,sensori.
3) Sfruttamento della conoscenza di dominio.La gestione intelligente dei
dati deve tenere conto dell'informazione esterna ai dati che può servire
per fornire risposte più accurate alle interrogazioni,e per estrarre
modelli più accurati dei dati.
4)Sviluppo di modelli formali per descrizione di processi sotto
differenti punti di vista(manageriale,decision (literal)
- Competenze
- La commessa raccoglie ricercatori con competenze specifiche in tecniche avanzate di gestione e analisi di dati, con particolare riferimento a tecniche di Data Warehousing, Data Mining e Knowledge Discovery e Sistemi Evoluti per la gestione di Basi di Dati. In particolare, l'attività dei ricercatori negli ultimi tre anni si è concentrata sulle seguenti tecniche di indagine: process mining ( analisi di pattern di processi frequenti, tecniche di clustering per l'individuazione di ontologie di processi); tecniche di clustering su grafi e sequenze mirate alla personalizzazione; co-clustering di dati ad alta dimensionalità; Tecniche ottimizzazione non lineare per problemi di classificazione; fuzzy matching e information extraction per l'individuazione di dati duplicati in ambiente datawarehousing/web; Compressione e aggiornamento di dati XML; Gestione, interrogazione e clustering/classificazione di flussi di dati. Tecniche di compressione per l'individuazione di anomalie in dati ad alta densità. (literal)
- Potenziale impiego per processi produttivi
- Le problematiche che si affrontano in questa commessa offrono la
possibilità di essere applicate in diversi settori applicativi quali
business intelligence, logistic intelligence, analisi del rischio (in
vari ambiti applicativi: socio-economico, scientifico), la bio-medicina,
processi produttivi. Inoltre, alcuni prodotti di questa commessa possono
proficuamente impiegati in contesti applicativi specifici, per la
gestione ottimizzata di risorse, ad esempio in ambito Web o Networking. (literal)
- Tecnologie
- Le metodologie di modellazione saranno quelle proprie dello sviluppo di algoritmi e delle strutture dati, della progettazione delle basi di dati, dell'ingegneria del software e dello sviluppo di nuove architetture. (literal)
- Obiettivi
- Obiettivo della commessa è lo sviluppo di strumenti avanzati basati sulla
combinazione di algoritmi,linguaggi,metodologie,tecniche innovative di
data mining e rappresentazione della conoscenza per i) gestire grandi
quantità di dati sia tradizionali sia su WEB ii) scoprire contenuti utili
memorizzati nei documenti, servizi e tracce di utilizzo, iii) produrre
nuove conoscenze e servizi. Per il conseguimento di tale obiettivo sono
definite tre linee di attività: analisi di dati complessi (mining
complex data), studio di Sistemi Evoluti per basi di Dati,analisi e
progettazione di sistemi per la generazione collaborativa di conoscenze
pubbliche.Per ognuna di queste linee sono di interesse i seguenti
obiettivi: algoritmi per l'analisi di descrizioni di processi, di dati a
struttura complessa (grafi,alberi,sequenze) e ad alta dimensionalità
(genomici, testuali),individuazione di anomalie,apprendimento
supervisionato,tecniche per l'aggregazione sommarizzazione di
dati,analisi e gestione di flussi continui di dati,gestione e
interrogazione di dati XML,entity resolution per l'integrazione di
dati. (literal)
- Stato dell'arte
- Negli ultimi anni la ricerca internazionale ha esteso le soluzioni
tradizionali di gestione e analisi dei dati con contributi specifici ai
nuovi scenari applicativi, quali il Web (ovvero, l'analisi e
l'interrogazione di dati semistrutturati/ad alta dimensionalità, la
social network analysis, e l'analisi di sequenze), il process mining
(ovvero, l'analisi dei flussi di cooperazione dei processi produttivi
orientati alla diagnosi e all'ottimizzazione), e l'utilizzo di tecniche
di machine learning e statistica per l'analisi di dati biologici e
gnomici, la eSanità. A questo fermento si è affiancata una maturità delle
tecniche di analisi e gestione dei dati cosiddetti \"tradizionali\", che ha
portato ad esempio allo sviluppo di tecniche di programmazione matematica
per il data mining, o le tecniche per la compressione dei dati. Per
quanto riguarda la eSanita', la deospedalizzazione dei pazienti ha fatto
nascere l'esigenza di processi di cura eseguiti in strutture sanitarie
virtuali e quindi la necessità di avere a disposizione cartelle cliniche
virtuali e di costruire workflow di cura navigando in biblioteche. (literal)
- Tecniche di indagine
- Molta dell'attività di ricerca sarà condotta attraverso tecniche di indagine basate sulla sperimentazione delle soluzioni architetturali proposte e degli algoritmi studiati attraverso la costruzione di prototipi. (literal)
- Descrizione di
Incoming links:
- Descrizione