LIAV (lessico dell' italiano audiovisivo): corpus lessicale audiovisivo per l'analisi, la sintesi e il riconoscimento bimodali dell'italiano parlato (Contributo in atti di convegno)

Type
Label
  • LIAV (lessico dell' italiano audiovisivo): corpus lessicale audiovisivo per l'analisi, la sintesi e il riconoscimento bimodali dell'italiano parlato (Contributo in atti di convegno) (literal)
Anno
  • 2002-01-01T00:00:00+01:00 (literal)
Alternative label
  • Magno Caldognetto E., Cosi P. (2002)
    LIAV (lessico dell' italiano audiovisivo): corpus lessicale audiovisivo per l'analisi, la sintesi e il riconoscimento bimodali dell'italiano parlato
    in TIPI 2002, tecnologie nella promozione della lingua italiana, Rome, Italy, June 25-26, 2002
    (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
  • Magno Caldognetto E., Cosi P. (literal)
Pagina inizio
  • 115 (literal)
Pagina fine
  • 119 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#altreInformazioni
  • Magno Caldognetto E., Cosi P. \"LIAV (lessico dell' italiano audiovisivo): corpus lessicale audiovisivo per l'analisi, la sintesi e il riconoscimento bimodali dell'italiano parlato\" Proceedings of TIPI 2002, tecnologie nella promozione della lingua italiana Rome, Italy, June 25-26, 2002 in La Comunicazione, Note Recensioni & Notizie, Numero Speciale Atti Conferenza TIPI Anno, 2002, Vol. LI, numero unico pp. 115-119 http://www.isticom.it/index.php/divulgazione/la-rivista http://www.isticom.it/documenti/rivista/2002_115.pdf (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#url
  • http://www.isticom.it/documenti/rivista/2002_115.pdf (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#titoloVolume
  • Atti della Conferenza TIPI 2002 (numero unico) (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#volumeInCollana
  • 1/2002 (literal)
Note
  • PuMa (literal)
  • S (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
  • ISTC CNR, UOS Padova (literal)
Titolo
  • LIAV (lessico dell' italiano audiovisivo): corpus lessicale audiovisivo per l'analisi, la sintesi e il riconoscimento bimodali dell'italiano parlato (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#curatoriVolume
  • Istituto Superiore delle Comunicazioni e delle Tecnologie dell'Informazione del Ministero dello Sviluppo Economico - Dipartimento per le Comunicazioni (literal)
Abstract
  • Poiché nella comunicazione orale facciaa-faccia il segnale verbale viene trasmesso contemporaneamente ad altre informazioni su più canali, in particolare ad informazioni visive, tra le tecnologie del parlato si stanno sempre più imponendo all'attenzione dei ricercatori la sintesi e il riconoscimento bimodali uditivo-visivi. Infatti, sebbene la modalità uditiva rappresenti il canale sensoriale più importante nel processo di percezione del parlato, è stato ormai accertato, sulla base delle ricerche sullo speech-reading o lip-reading [1-3], che l'informazione estratta dai movimenti articolatori visibili (movimento delle labbra, della mandibola, della lingua e visibilità dei denti), consente di migliorarne l'intelligibilità soprattutto quando il segnale acustico risulta degradato dalla presenza di rumore [4-6] oppure quando le capacità percettive dell'ascoltatore siano state danneggiate da patologie dell'udito. Questo successo della percezione bimodale nell'identificazione delle unità fonologiche segmentali e quindi delle uscite lessicali si basa, intuitivamente, sul sinergismo tra le informazioni uditive e visive relative ad uno stesso fonema, in quanto prodotti sensoriali della realizzazione fonetica di uno stesso intento fonologico e collegati tra loro dalla relazione causale esistente tra movimenti articolatori e segnale acustico risultante. Grazie a tale sinergismo risulta raccomandabile l'applicazione sistemi di sintesi e riconoscimento bimodali in vari tipi di interazione uomo-macchina per soggetti normali e patologici. La sintesi audiovisiva può rendere infatti più naturale, robusto e amichevole l'accesso a tutti i tipi di banche-dati, dalla lettura di notiziari all'e-commerce, dalla didattica (insegnamento della lingua materna e di lingue straniere) alla pratica clinica e logopedica per la valutazione e riabilitazione dei soggetti ipoacusici e può essere utilizzata nella videotelefonia, nelle teleconferenze, nell'industria cinematografica e televisiva (cartoni animati, videogiochi, doppiaggio, \"sottotitolatura\" di messaggi in LIS, Lingua Italiana dei Segni, creazione di Attori Virtuali, ecc). Anche per i sistemi di riconoscimento automatico l'approccio bimodale fa prevedere notevoli vantaggi soprattutto qualora la decodificazione del parlato debba avvenire in ambiente rumoroso, come avviene in tutte le applicazioni reali del riconoscimento vocale, o in condiz (literal)
Prodotto di
Autore CNR
Insieme di parole chiave

Incoming links:


Autore CNR di
Prodotto
Insieme di parole chiave di
data.CNR.it