Descrizione della commessa "Gestire, Estrarre Conoscenza e Ragionare sui Dati (ICT.P08.002)"

Type
Label
  • Descrizione della commessa "Gestire, Estrarre Conoscenza e Ragionare sui Dati (ICT.P08.002)" (literal)
Potenziale impiego per bisogni individuali e collettivi
  • Il settore ICT è considerato come il settore chiave per la società della conoscenza, in quanto cruciale per la competitività europea, lo sviluppo industriale e l'impatto sui servizi e la qualità di vita. Le \"tecnologie basate sulla conoscenza\", anche dette \"tecnologie intelligenti\", e tra queste quelle di estrazione della conoscenza e delle buone pratice di comportamento giocheranno un ruolo sempre maggiore all'interno del settore ICT nella modernizzazione della nostra società, nello sviluppo di nuovi prodotti e servizi al cittadino. Un modulo della commessa ha come obiettivo specifico contribuire all'elaborazione di modelli per una più efficace erogazione dei servizi sanitari. (literal)
Strumentazione
  • La strumentazione a disposizione dei ricercatori partecipanti alla commessa consiste in una serie personal computer e ambienti e strumenti integrati di sviluppo di applicazioni. In aggiunta, si hanno a disposizione diversi cluster di computers ad alte prestazioni presenti presso le sedi di Cosenza, Napoli e Palermo. (literal)
Tematiche di ricerca
  • La grande quantità e diversità di dati oggi disponibili introduce seri problemi per la loro rappresentazione e gestione. Le tecniche tradizionali di gestione e analisi dei dati sono inadatte ai contesti applicativi emergenti e predominanti,quali Web,business process modeling,bioinformatica. La commessa si concentra sulle tematiche di ricerca connesse all'analisi, all'estrazione di conoscenza e alla gestione dei dati generati da questi nuovi scenari applicativi. In particolare l'interesse è sui seguenti temi:1)Tipi differenti di dati.Accanto ai classici dati numerici/categorici/simbolici,si considerano dati complessi(grafi,alberi,sequenze,testi,ad alta dimensionalità). 2) Flussi continui e distribuiti.I dati possono provenire da sorgenti distribuite ed eterogenee,quali documenti testuali,sensori. 3) Sfruttamento della conoscenza di dominio.La gestione intelligente dei dati deve tenere conto dell'informazione esterna ai dati che può servire per fornire risposte più accurate alle interrogazioni,e per estrarre modelli più accurati dei dati. 4)Sviluppo di modelli formali per descrizione di processi sotto differenti punti di vista(manageriale,decision (literal)
Competenze
  • La commessa raccoglie ricercatori con competenze specifiche in tecniche avanzate di gestione e analisi di dati, con particolare riferimento a tecniche di Data Warehousing, Data Mining e Knowledge Discovery e Sistemi Evoluti per la gestione di Basi di Dati. In particolare, l'attività dei ricercatori negli ultimi tre anni si è concentrata sulle seguenti tecniche di indagine: process mining ( analisi di pattern di processi frequenti, tecniche di clustering per l'individuazione di ontologie di processi); tecniche di clustering su grafi e sequenze mirate alla personalizzazione; co-clustering di dati ad alta dimensionalità; Tecniche ottimizzazione non lineare per problemi di classificazione; fuzzy matching e information extraction per l'individuazione di dati duplicati in ambiente datawarehousing/web; Compressione e aggiornamento di dati XML; Gestione, interrogazione e clustering/classificazione di flussi di dati. Tecniche di compressione per l'individuazione di anomalie in dati ad alta densità. (literal)
Potenziale impiego per processi produttivi
  • Le problematiche che si affrontano in questa commessa offrono la possibilità di essere applicate in diversi settori applicativi quali business intelligence, logistic intelligence, analisi del rischio (in vari ambiti applicativi: socio-economico, scientifico), la bio-medicina, processi produttivi. Inoltre, alcuni prodotti di questa commessa possono proficuamente impiegati in contesti applicativi specifici, per la gestione ottimizzata di risorse, ad esempio in ambito Web o Networking. (literal)
Tecnologie
  • Le metodologie di modellazione saranno quelle proprie dello sviluppo di algoritmi e delle strutture dati, della progettazione delle basi di dati, dell'ingegneria del software e dello sviluppo di nuove architetture. (literal)
Obiettivi
  • Obiettivo della commessa è lo sviluppo di strumenti avanzati basati sulla combinazione di algoritmi,linguaggi,metodologie,tecniche innovative di data mining e rappresentazione della conoscenza per i) gestire grandi quantità di dati sia tradizionali sia su WEB ii) scoprire contenuti utili memorizzati nei documenti, servizi e tracce di utilizzo, iii) produrre nuove conoscenze e servizi. Per il conseguimento di tale obiettivo sono definite tre linee di attività: analisi di dati complessi (mining complex data), studio di Sistemi Evoluti per basi di Dati,analisi e progettazione di sistemi per la generazione collaborativa di conoscenze pubbliche.Per ognuna di queste linee sono di interesse i seguenti obiettivi: algoritmi per l'analisi di descrizioni di processi, di dati a struttura complessa (grafi,alberi,sequenze) e ad alta dimensionalità (genomici, testuali),individuazione di anomalie,apprendimento supervisionato,tecniche per l'aggregazione sommarizzazione di dati,analisi e gestione di flussi continui di dati,gestione e interrogazione di dati XML,entity resolution per l'integrazione di dati. (literal)
Stato dell'arte
  • Negli ultimi anni la ricerca internazionale ha esteso le soluzioni tradizionali di gestione e analisi dei dati con contributi specifici ai nuovi scenari applicativi, quali il Web (ovvero, l'analisi e l'interrogazione di dati semistrutturati/ad alta dimensionalità, la social network analysis, e l'analisi di sequenze), il process mining (ovvero, l'analisi dei flussi di cooperazione dei processi produttivi orientati alla diagnosi e all'ottimizzazione), e l'utilizzo di tecniche di machine learning e statistica per l'analisi di dati biologici e gnomici, la eSanità. A questo fermento si è affiancata una maturità delle tecniche di analisi e gestione dei dati cosiddetti \"tradizionali\", che ha portato ad esempio allo sviluppo di tecniche di programmazione matematica per il data mining, o le tecniche per la compressione dei dati. Per quanto riguarda la eSanita', la deospedalizzazione dei pazienti ha fatto nascere l'esigenza di processi di cura eseguiti in strutture sanitarie virtuali e quindi la necessità di avere a disposizione cartelle cliniche virtuali e di costruire workflow di cura navigando in biblioteche. (literal)
Tecniche di indagine
  • Molta dell'attività di ricerca sarà condotta attraverso tecniche di indagine basate sulla sperimentazione delle soluzioni architetturali proposte e degli algoritmi studiati attraverso la costruzione di prototipi. (literal)
Descrizione di

Incoming links:


Descrizione
data.CNR.it