http://www.cnr.it/ontology/cnr/individuo/prodotto/ID64493
Risorse monolingui e multilingui. Corpus bilingue italiano-arabo (Articolo in rivista)
- Type
- Label
- Risorse monolingui e multilingui. Corpus bilingue italiano-arabo (Articolo in rivista) (literal)
- Anno
- 2003-01-01T00:00:00+01:00 (literal)
- Alternative label
Picchi E. , Sassolini E. , Nahli O. , Cucurullo S. (2003)
Risorse monolingui e multilingui. Corpus bilingue italiano-arabo
in Linguistica computazionale (Online)
(literal)
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
- Picchi E. , Sassolini E. , Nahli O. , Cucurullo S. (literal)
- Pagina inizio
- Pagina fine
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#altreInformazioni
- La linea di ricerca descritta nellarticolo, che ha portato allo sviluppo di tutto un insieme di strumenti e di risorse per il trattamento della lingua araba, ha aperto nuove line di collaborazione in varie direzioni: in chiave internazionale ha permesso allILC di collaborare con il progetto NEMLAR (Network for Euro-Mediterranean Language Resource and human language technology develpment and support) sponsorizzato dalla comunità europea; in Italia sono in corso contatti con industrie del settore tecnologico per collaborare alla creazione di strumenti di analisi automatica di grandi quantità di documenti in lingua araba (procedure di text mining); in collaborazione con lUniversità della Calabria è stato preparato un progetto FIRB, sottoposto al MIUR, per la estrazione automatica di glossari bilingui italo-arabi a partire da materiale testuale bilingue. (literal)
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#numeroVolume
- Rivista
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#note
- In A. Zampolli, N. Calzolari, L. Cignoni, (eds.), Computational Linguistics in Pisa - Linguistica Computazionale a Pisa, IEPI, Pisa-Roma. (literal)
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#descrizioneSinteticaDelProdotto
- Il progetto per il trattamento, lanalisi e lo sfruttamento di materiali testuali multilingui italiano-arabi nasce dalla intuizione e dalla valutazione del valore strategico di strumenti in grado di interfacciarsi con la lingua araba. E' evidente limportanza dei rapporti con il mondo arabo per lo sviluppo di relazioni culturali, commerciali e per la particolare situazione politica internazionale creatasi dopo l11 settembre 2001. Il progetto descritto è stato selezionato e finanziato nellambito della legge 488, prevede la collaborazione dellIstituto Universitario Orientale di Napoli e dellUniversità di Pisa, assegnando allILC il compito di fornire la guida scientifica allo sviluppo informatico dellintero progetto, di fornire tecnologie di background e di sviluppare i nuovi strumenti: in particolare quelli per la gestione e lanalisi della lingua araba. Vengono descritti i principali componenti sviluppati: motore morfologico per larabo in grado di automatizzare le fasi di generazione e di analisi morfologica con alto livello qualitativo; un sistema per la classificazione morfosintattica automatica con utilizzo di training corpus; la procedura per lallineamento automatico di testi bilingui paralleli italiani-arabi; le procedure di interrogazione e di navigazione nel corpus bilingue per tutti i livelli di analisi e di classificazione ottenuti (i singoli corpora testuali, i corpora annotati morfo-sintatticamente; i corpora paralleli contrastivi). (literal)
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
- Istituto di Linguistica Computazionale \"A. Zampolli\", Consiglio Nazionale delle Ricerche (literal)
- Titolo
- Risorse monolingui e multilingui. Corpus bilingue italiano-arabo (literal)
- Abstract
- Abstract - The objective of the project is twofold: on the one hand, the
creation and elaboration of software procedures for the Arabic language
and, on the other hand, the creation of linguistic resources for the
management of large Arabic corpora. The linguistic resources are
substantially the following: a) Morphological engine for the Arabic
language. The engine is constituted by a number of modules: the
algorithms and modules for generation and analysis, an appropriate
encoding system for the representation of lexical data and of
morphological characteristics of Arabic, the so-called lemmario, i.e.
the archive of lemmas; b) The automatic alignment of parallel texts in
Italian and Arabic language; c) Automatic tagging of Arabic texts,
performed by using the above morphological engine; d) Systems for
accessing and querying (raw and/or tagged) Arabic texts and parallel
Italian-Arabic corpora. (literal)
- Prodotto di
- Autore CNR
- Insieme di parole chiave
Incoming links:
- Prodotto
- Autore CNR di
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#rivistaDi
- Insieme di parole chiave di