Risorse monolingui e multilingui. Corpus bilingue italiano-arabo (Articolo in rivista)

Type
Label
  • Risorse monolingui e multilingui. Corpus bilingue italiano-arabo (Articolo in rivista) (literal)
Anno
  • 2003-01-01T00:00:00+01:00 (literal)
Alternative label
  • Picchi E. , Sassolini E. , Nahli O. , Cucurullo S. (2003)
    Risorse monolingui e multilingui. Corpus bilingue italiano-arabo
    in Linguistica computazionale (Online)
    (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
  • Picchi E. , Sassolini E. , Nahli O. , Cucurullo S. (literal)
Pagina inizio
  • 629 (literal)
Pagina fine
  • 678 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#altreInformazioni
  • La linea di ricerca descritta nell’articolo, che ha portato allo sviluppo di tutto un insieme di strumenti e di risorse per il trattamento della lingua araba, ha aperto nuove line di collaborazione in varie direzioni: in chiave internazionale ha permesso all’ILC di collaborare con il progetto NEMLAR (Network for Euro-Mediterranean Language Resource and human language technology develpment and support) sponsorizzato dalla comunità europea; in Italia sono in corso contatti con industrie del settore tecnologico per collaborare alla creazione di strumenti di analisi automatica di grandi quantità di documenti in lingua araba (procedure di text mining); in collaborazione con l’Università della Calabria è stato preparato un progetto FIRB, sottoposto al MIUR, per la estrazione automatica di glossari bilingui italo-arabi a partire da materiale testuale bilingue. (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#numeroVolume
  • 18-19 (literal)
Rivista
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#note
  • In A. Zampolli, N. Calzolari, L. Cignoni, (eds.), Computational Linguistics in Pisa - Linguistica Computazionale a Pisa, IEPI, Pisa-Roma. (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#descrizioneSinteticaDelProdotto
  • Il progetto per il trattamento, l’analisi e lo sfruttamento di materiali testuali multilingui italiano-arabi nasce dalla intuizione e dalla valutazione del valore strategico di strumenti in grado di interfacciarsi con la lingua araba. E' evidente l’importanza dei rapporti con il mondo arabo per lo sviluppo di relazioni culturali, commerciali e per la particolare situazione politica internazionale creatasi dopo l’11 settembre 2001. Il progetto descritto è stato selezionato e finanziato nell’ambito della legge 488, prevede la collaborazione dell’Istituto Universitario Orientale di Napoli e dell’Università di Pisa, assegnando all’ILC il compito di fornire la guida scientifica allo sviluppo informatico dell’intero progetto, di fornire tecnologie di background e di sviluppare i nuovi strumenti: in particolare quelli per la gestione e l’analisi della lingua araba. Vengono descritti i principali componenti sviluppati: motore morfologico per l’arabo in grado di automatizzare le fasi di generazione e di analisi morfologica con alto livello qualitativo; un sistema per la classificazione morfosintattica automatica con utilizzo di training corpus; la procedura per l’allineamento automatico di testi bilingui paralleli italiani-arabi; le procedure di interrogazione e di navigazione nel corpus bilingue per tutti i livelli di analisi e di classificazione ottenuti (i singoli corpora testuali, i corpora annotati morfo-sintatticamente; i corpora paralleli contrastivi). (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
  • Istituto di Linguistica Computazionale \"A. Zampolli\", Consiglio Nazionale delle Ricerche (literal)
Titolo
  • Risorse monolingui e multilingui. Corpus bilingue italiano-arabo (literal)
Abstract
  • Abstract - The objective of the project is twofold: on the one hand, the creation and elaboration of software procedures for the Arabic language and, on the other hand, the creation of linguistic resources for the management of large Arabic corpora. The linguistic resources are substantially the following: a) Morphological engine for the Arabic language. The engine is constituted by a number of modules: the algorithms and modules for generation and analysis, an appropriate encoding system for the representation of lexical data and of morphological characteristics of Arabic, the so-called “lemmario”, i.e. the archive of lemmas; b) The automatic alignment of parallel texts in Italian and Arabic language; c) Automatic tagging of Arabic texts, performed by using the above morphological engine; d) Systems for accessing and querying (raw and/or tagged) Arabic texts and parallel Italian-Arabic corpora. (literal)
Prodotto di
Autore CNR
Insieme di parole chiave

Incoming links:


Prodotto
Autore CNR di
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#rivistaDi
Insieme di parole chiave di
data.CNR.it