http://www.cnr.it/ontology/cnr/individuo/descrizionemodulo-descrizionemodulo/ID7394
Descrizione del modulo "Sistemi per la gestione e classificazione di dati biologici (INT.P02.014.004)"
- Type
- Label
- Descrizione del modulo "Sistemi per la gestione e classificazione di dati biologici (INT.P02.014.004)" (literal)
- Potenziale impiego per bisogni individuali e collettivi
- Il bisogno cui si intende dare risposta è costituito dalla richiesta dei ricercatori di strumenti dotati di interfacce amichevoli per la gestione dei risultati di esperimenti di natura biologica.
La possibilità di miglioramento delle tecniche, degli strumenti e degli ambienti di diagnostica medica puo' inoltre impattare le esigenze della comunità di fornire una assistenza sanitaria di qualità a costi sempre più contenuti. (literal)
- Tematiche di ricerca
- Un primo obiettivo la realizzazione di sistemi per la gestione di alcune classi di dati biologici; tali sistemi dovranno consentire l'archiviazione sicura ed efficiente di tali dati e agevolare la condivisione di tali dati sia all'interno di un gruppo di ricerca che con il resto della comunità scientifica.
Per il problema della interpretazione di tali dati si valuterà la possibilità di applicare gli strumenti propri dell'intelligenza artificiale al problema della classificazione dei dati ottenuti dall'analisi di pazienti affetti dalle varie patologie oggetto di studio e pazienti di controllo. Particolare attenzione sarà posta (ove ovviamente necessario) al problema della fetaures extraction, alla valutazione delle prestazioni e alla interpretabilità dei classificatori ottenuti.
Il problema della sommarizzazione sara' affrontato con una tecnica innovativa basato sul clustering di triplette RDF.
I sistemi di recommendation combineranno features di basso livello e di alto livello per stabilire la similarità di oggetti. Inoltre ci si baserà sulla social theory e su algoritmi di ranking up to date per portare in conto la similarità tra gli utenti. (literal)
- Competenze
- Al modulo partecipano ricercatori con esperienze nel settori della biologia e ricercatori con esperienza nel settore dell'ICT.
Compito dei ricercatori ICT è l'individuazione dei requisiti delle applicazioni e dei DB e della loro successiva formalizzazione. Detti ricercatori si faranno anche carico dello sviluppo delle applicazioni coadiuvati, ove possibile e opportuno, da tesisti delle Facoltà di Ingegneria Informatica dell'Università degli Studi di Napoli \"Federico II\" e della Seconda Università degli Studi di Napoli.
Compito dei ricercatori con esperienza nella Biologia e più in generale nei domini propri delle Scienze della Vita sarà fornire le competenze necessarie ad individuare i requirements delle applicazioni e dei databases oltre a fornire i primi dati per popolare e validare i databases e gli applicativi creati. Per lo sviluppo di sistemi di supporto alle decisioni, sarà ovviamente loro compito fornire la conoscenza di partenza.
Verrà inoltre valutato la possibilità di utilizzare contrattisti e/o assegnisti. (literal)
- Tecnologie
- Nello sviluppo dei WPs costituenti il modulo ci si avvarrà di metodologie e strumenti che rappresentano lo stato dell'arte nell'ICT.
I particolare i DB verranno progettati attraverso la metodologia a tre livelli (concettuale, logico, fisico) che rappresenta lo standard de facto in questo settore.
Le applicazioni verranno progettate utilizzando i formalismi propri dell'UML.
Le applicazioni WEB verranno sviluppate facendo riferimento al mondo JAVA con particolare riferimento ai framework della famiglia MVC (struts e/o JSF).
Gli applicativi per la classificazione verranno realizzati, in prima istanza, usando MATLAB come ambiente di sviluppo e su valuterà la possibilità di utilizzare dei cluster per le sperimentazioni. (literal)
- Obiettivi
- Ci si propone di realizzare Banche Dati per dati provenienti da esperimenti complessi di spettrometria di massa.
Ci si propone di realizzare applicativi WEB che permettano, attraverso Internet, la gestione di dette Banche Dati. Le Banche Dati saranno rese disponibili sul WEB (compatibilmente con la proprietà e la privatezza dei dati).
Ci si propone di realizzare algoritmi di preprocessing e classificazione per tali dati e di effettuare esperimenti su banche dati pubbliche allo scopo di confrontarsi con altre soluzioni proposte in letteratura.
Ci si propone di realizzare sistemi di supporto diagnostico per alcune malattie assunte come casi di prova.
Ci si propone di realizzare sistemi di sommarizzazione e di recommendation. (literal)
- Stato dell'arte
- Non è difficile imbattersi in servizi di interrogazione a Banche Dati Biologiche; tali servizi, pero', tipicamente non offrono servizi di storing, servizi che del resto sarebbero difficilmente usati dal Ricercatore medio, restio ad affidare a terzi i risultati del proprio lavoro. Molto più interessante sarebbe invece disporre di applicazioni liberamente scaricabili che possano aiutare a creare repository locali dei dati, appoggiarsi a piattaforme di tipo freeware/open-source (a partire dal DBMS).
Con riferimento ai problemi di classificazione, molte soluzioni sono state proposte in letteratura; in molti casi, pero', gli ottimi risultati sono stati ottenuti o scegliendo features particolari senza giustificare appieno tale scelta, o utilizzando per la features extraction anche il test set. Con tali soluzioni ci si confronterà cercando ovviamente di migliorarle.
La sommarizzazione e' stata studiata a lungo a partire dal fondamentale lavoro di Luhn nel 1958. Il processo puo' produrre un estratto o un abstract ed essere informativo o indicativo.
I sistemi di recommendation sono classificati in content based, collaborative systems e ibridi. (literal)
- Tecniche di indagine
- L'indagine verra' svolta attraverso lo sviluppo di simulatori software. (literal)
- Descrizione di
Incoming links:
- Descrizione