http://www.cnr.it/ontology/cnr/individuo/descrizionemodulo-descrizionemodulo/ID2110
Descrizione del modulo "Data Mining, Identificazione e Stima per Sistemi Complessi (ICT.P11.004.001)"
- Type
- Label
- Descrizione del modulo "Data Mining, Identificazione e Stima per Sistemi Complessi (ICT.P11.004.001)" (literal)
- Potenziale impiego per bisogni individuali e collettivi
- Diverse applicazioni dei metodi sviluppati nell'ambito delle attività della commessa sono riferiti alla produzione di soluzioni per bisogni individuali e collettivi. In generale si fa riferimento ai settori della protezione dell'ambiente, della medicina e della biomedicina ed alle scienze sociali, dove gli strumenti di modellistica di fenomeni complessi vengono impiegati per analizzare grandi moli di dati sociali, demografici ed economici. (literal)
- Tematiche di ricerca
- Le tematiche di ricerca di questo modulo coincidono con quelle della commessa \"Data Mining, Identificazione e Stima per Sistemi Complessi\".
. Le attività della commessa si collocano prevalentemente nelle aree della Ricerca Operativa, della Teoria dei Sistemi, della Ottimizzazione Matematica e della Statistica. Gli algoritmi considerati si prefiggono tipicamente la minimizzazione di una funzione di errore espressa in spazi ad elevate dimensioni. In molti casi la funzione da minimizzare è di natura non lineare. I campi di applicazione sono le telecomunicazioni, le applicazioni di diagnostica biomedica, l'analisi dei dati finanziari, i trasporti, ed in generale l'implementazione di codice per l'ottimizzazione non lineare ed intera specifico per problemi di stima e classificazione, ed in generale, di Data Mining.
La commessa si articola in quattro tematiche di ricerca principali:
Ottimizzazione non lineare per il Data Mining
Metodi di controllo e filtraggio non lineare e stocastico
Algoritmi per il Data Mining
Metodi di valutazione della produzione scientifica (literal)
- Competenze
- Le competenze impiegate nella commessa attengono principalmente all'area della programmazione ed ottimizzazione matematica, della teoria della stima e del controllo, della programmazione logica e della analisi dei dati. In particolare, sono impiegate competenze avanzate nel campo della ottimizzazione non lineare ed intera, con riferimento alla minimizzazione di funzioni di errore quadratico ed alla modellazione di relazioni esplicative tramite funzioni kernel, nella ottimizzazione di sistemi a numeri interi associati a problemi di apprendimento in contesti logici, nel controllo di sistemi complessi non lineari, nella valutazione della produzione scientifica. Tali competenze sono rappresentate in modo eccellente dai ricercatori che partecipano alle attività, sia da punto di vista della qualità scientifica che da quello delle complementarità delle competenze. (literal)
- Potenziale impiego per processi produttivi
- Le potenzialità di impiego in processi produttivi dei risultati della commessa si riferiscono a diversi campi di applicazione, nei quali la rilevanza delle tecniche avanzate di modellizzazione e di analisi dei dati stanno acquisendo una importanza crescente. Diversi dei progetti sviluppati
nell'ambito delle attività della commessa si riferiscono a:
-metodi di fault identification nei processi di produzione;
-classificazione della clientela per servizi bancari e finanziari;
-realizzazione di strumenti avanzati di diagnostica medica;
-metodi di stima del segnale efficiente per sistemi di telecomunicazione. (literal)
- Tecnologie
- Gli aspetti tecnologici di questa attività sono legati prevalentemente all'impiego di software e di tecniche di progettazione e sviluppo dello stesso. Viene impiegato i software commerciale che mette a disposizione lo stato dell'arte nella risoluzione di problemi di ottimizzazione matematica e stima di modelli di analisi dei dati, congiuntamente a software sviluppato all'interno dell'istituto negli anni precedenti. Parte delle attività saranno inoltre corredate dallo sviluppo di software ad hoc progettato e realizzato per la soluzione ottimale degli specifici problemi affrontati, tramite linguaggi di programmazione di basso livello orientati al calcolo scientifico (in prevalenza C, C++). (literal)
- Obiettivi
- Gli obiettivi del modulo coincidono con quelli della commessa \"Data Mining, Identificazione e Stima per Sistemi Complessi\", e riguardano:
- studio e l'implementazione di algoritmi per la stima di modelli lineari e non lineari per dataset di grandi dimensioni
- realizzazione di sistemi avanzati per le tecniche di apprendimento in contesti logici
- data mining tramite algoritmi distribuiti e grid computing
- sviluppo di modelli avanzati di controllo e filtraggio non lineare e stocastico
- metodi avanzati di bibliometria e misurazione della produzione scientifica (literal)
- Stato dell'arte
- L'attività di ricerca nel settore di interesse della commessa ha prodotto risultati importanti che hanno comportato una ricaduta tecnologica rilevante anche dal punto di vista delle potenzialità applicative: sistemi di classificazione automatica e pattern recognition estremamente efficienti per data set di dimensioni elevate tramite SVM e reti neurali, estrazione di conoscenza fruibile tramite metodi di Data Mining logico, sistemi di filtraggio polinomiale e metodi di identificazione e stima per sistemi complessi da applicare a problemi di controllo automatico tipici e della automazione industriale. A partire dai risultati conseguiti è necessario approfondire tali tematiche per applicarle a problemi nuovi e più complessi sia sul fronte della ricerca metodologica sui metodi e sugli algoritmi, sia su quello della integrazione delle diverse competenze che compongono la commessa. La commessa si avvale anche delle attività relative ai metodi di valutazione della produzione scientifica, una tematica di estremo interesse basata su competenze multidisciplinari nei metodi bibliometrici e nella statistica multivariata. (literal)
- Tecniche di indagine
- Le tecniche di indagine impiegate sono quelle tipiche della ricerca scientifica nel campo della matematica teorica ed applicata, con un ruolo particolare riservato alle tecniche sperimentali ed alla simulazione. Tale considerazione è valida per tutte le metodologie che interessano queste attività, come ad esempio i metodi di stima di modelli con errore minimo, la determinazione di formule logiche tramite programmazione intera o la stima dei parametri di un sistema di controllo in tempo reale. Per quanto riguarda lo sviluppo di metodi e strumenti algoritmici per la risoluzione dei problemi si attua, come è prassi, il metodo del benchmarking su insiemi di problemi test con lo stato dell'arte disponibile nella letteratura scientifica. Analogamente, nel caso di sviluppo di modelli interpretativi dei dati, il paradigma scientifico di riferimento sarà quello tipico dei metodi di apprendimento induttivo, ovvero il test su dati reali. Nel caso di problemi la cui formalizzazione non è ancora consolidata nella comunità scientifica, si farà particolare attenzione alla interazione con scienziati ed esperti dei settori applicativi per validare la significatività di risultati ottenuti. (literal)
- Descrizione di
Incoming links:
- Descrizione