Informaciones estadísticas en CALIS: Corpus y Archivo Léxical del Italiano Escrito (Contributo in atti di convegno)

Type
Label
  • Informaciones estadísticas en CALIS: Corpus y Archivo Léxical del Italiano Escrito (Contributo in atti di convegno) (literal)
Anno
  • 2005-01-01T00:00:00+01:00 (literal)
Alternative label
  • Paola Cutugno; Lucia Marconi; Daniela Ratti; Claudia Rolando (2005)
    Informaciones estadísticas en CALIS: Corpus y Archivo Léxical del Italiano Escrito
    in IX Simposio Internacional Comunicación Social, Santiago de Cuba, 24 - 28 Gennaio 2005
    (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
  • Paola Cutugno; Lucia Marconi; Daniela Ratti; Claudia Rolando (literal)
Pagina inizio
  • 361 (literal)
Pagina fine
  • 365 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#altreInformazioni
  • Informazioni statistiche del Corpus e Archivio Lessicale dell'italiano scritto. (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#url
  • http://www.santiago.cu/hosting/linguistica/descargar.php?d=194 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#titoloVolume
  • Actas-I IX Simposio Internacional Comunicación Social (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
  • Istituto di Linguistica Computazionale \"Antonio Zampolli\" - U.O.S. di Genova - CNR; Istituto di Linguistica Computazionale \"Antonio Zampolli\" - U.O.S. di Genova - CNR; Istituto di Linguistica Computazionale \"Antonio Zampolli\" - U.O.S. di Genova - CNR; Istituto di Linguistica Computazionale \"Antonio Zampolli\" - U.O.S. di Genova - CNR. (literal)
Titolo
  • Informaciones estadísticas en CALIS: Corpus y Archivo Léxical del Italiano Escrito (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#isbn
  • 959-7174-04-9 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#curatoriVolume
  • Celia Alvarez Moreno; Jorge Perez Bolaños; Laritza Hernandez Rojas; Leonel Ruiz Miyares (literal)
Abstract
  • Informaciones estadísticas en CALIS: Corpus y Archivo Léxical del Italiano Escrito. CALIS es una base de datos de la lengua italiana escrita de 3.798.275 palabras y esta formada de textos escritos de varios generes pesados oportunamente y selecionados en tres distintos sectores: diaros, periodicos y libros. Este producto representa el italiano efectivamente leido mas bien que toda la lengua italiana escrita. Esta eleccion se justifica en cuanto se deseaba construir un corpus, y en consecuencia un lexico de frecuencia, que se acercara los mas posible al lexico mental de un hablante de media cultura y no a un diccionario de la lengua italiana. Los diarios con 1.836.119 palabras estan extraido de tres diarios que son los mas importantes y leidos en Italia: Il Corriere Della Sera, Repubblica, La Stampa. En cada diario se han elegidos textos de 9 diferentes subsectores: economia, cronica local, cronica mundana, cronica negra, politica exterior, politica interior, ciencia, espectaculo y deporte. El sector de los periodicos esta constituido por 1.306.653 palabras elejdas entre 12 differentes subsectores: arte-ciencia-tecnica, auto-nautica, ninos-muchachos, casa-hobby, feminil, fotonovelas, informacion general, cronica mundana, radio-television, deporte, viajes-ecologia y otro. El sector de los libros esta constituido por 655.503 palabras elejdas entre 13 generos literarios: arte, ninos, fantascienza, gialli espionaje, hobby y viajes, narrativa clasica, narrativa moderna, rosa, ensaystica, ciencias naturales y exactas, ciencias sociales y humanas, teatro y poesia. En este trabajo se analizan las informaciones extraidas del lexico de frecuencia del corpus lematizado de CALIS (Corpus e Archivio Lessicale Italiano Scritto) relativamente a las diferentes categorias gramaticales, a los datos de frecuencia y de dispercion de cada lemma y de cada forma en los distintos sectores y subsectores. Se efectuan por algunos sectores analisis sobre el acrecentamiento de las formas/lemas con el fin de efectuar una evaluacion sobre las posibles y corectas dimensiones de un corpus para ser representativo de la lengua analizada. (literal)
Editore
Prodotto di
Autore CNR
Insieme di parole chiave

Incoming links:


Autore CNR di
Prodotto
Editore di
Insieme di parole chiave di
data.CNR.it