Istituto opera del vocabolario italiano (OVI)

Type
Label
  • Istituto opera del vocabolario italiano (OVI) (literal)
  • The italian dictionary (OVI) (literal)
Comment
  • L'Opera del Vocabolario Italiano (OVI) è l'Istituto del CNR che ha per missione il vocabolario storico italiano. In particolare, redige attualmente il vocabolario dell'italiano antico (prima parte del vocabolario storico), intitolato \"Tesoro della Lingua Italiana delle Origini\" (TLIO). Caratteristica dell'OVI è l'identificazione fra l'Istituto e il preciso compito del vocabolario storico italiano, intorno al quale ruotano tutte le attività. L'attività dell'OVI prosegue un progetto avviato dall'Accademia della Crusca nel 1965. Grazie al finanziamento del CNR, la Crusca avviò allora i lavori di un nuovo vocabolario storico, erede del \"Vocabolario degli Accademici\", ma diverso, perché non più normativo, cioè rivolto a proporre un modello di lingua, ma storico, cioè rivolto a documentare il lessico italiano ed i suoi usi reali nel corso della storia. Risale alla Crusca la scelta di spogliare i testi con l'ausilio dell'elaborazione informatica, per rendere disponibile una documentazione in gran parte nuova rispetto alla tradizione lessicografica. Nel 1973 la Crusca decise di dividere il progetto in due sezioni cronologiche, separate dalla 'data simbolo' della morte di Boccaccio (1375), e di concentrare il lavoro unicamente sulla parte più antica, che richiede metodi diversi rispetto a quella successiva. Nel 1983 (legge 6.1.1983 n. 6) il personale della Crusca passò nei ruoli del CNR e fu avviata la costituzione del Centro di studi Opera del Vocabolario Italiano, che divenne operativo nel 1985. Il Centro di studi è stato successivamente confermato, con lo stesso nome e senza aggregazioni, come Istituto, ed è operativo come tale dal 15 giugno 2002. Le attività principali sono: 1) la redazione del Tesoro della Lingua Italiana delle Origini (TLIO), giunta a settembre 2014 a oltre 29.000 voci pubblicate in Internet; 2) lo sviluppo, in funzione della redazione del TLIO, della banca dati dell'italiano antico, che è anche un autonomo strumento di ricerca linguistica e lessicografica consultabile in Internet; 3) lo sviluppo di software per la lessicografia e la linguistica, e in particolare per la creazione e gestione di banche dati testuali quale quella su cui si fonda il TLIO. L'OVI pubblica un Bollettino annuale, giunto al volume XVIII (2013), nel quale vengono pubblicati specimina delle voci del TLIO (a partire dal volume II), un indice generale delle voci consultabili in Internet (a partire dal volume V), e articoli di filologia (in particolare edizioni di testi da inserire nella banca dati) e di 'informatica umanistica' (sull'elaborazione della banca dati dell'OVI, su GATTO, su GattoWeb, sul programma di consultazione delle voci in Internet). Pubblica inoltre un Supplemento al Bollettino, giunto al volume IV (2013), si raccolgono atti di convegno svolti in Istituto e studi lessicografici. Bollettino e Supplemento sono editi dalle Edizioni dell'Orso di Alessandria. Il gruppo di lavoro dell'OVI è composto a settembre 2014 da 1 primo ricercatore, 7 ricercatori, 2 collab. tecnici enti di rcerca, 1 collab. amministrativo, 3 assegnisti di ricerca, 1 associato in ruolo all'Università. L'apporto di collaboratori esterni con incarico di ricerca è indispensabile, e l'Istituto vi ricorre nei limiti, generalmente stretti, delle risorse. È un gruppo di lavoro piccolo, paragonato con altre imprese lessicografiche quale quella che realizzò il \"Trésor de la Langue Française\" o quella che sta preparando la terza edizione dell' \"Oxford English Dictionary\". Ciò considerato, i risultati si devono considerare soddisfacenti. (literal)
  • The Italian Dictionary (OVI-Opera del Vocabolario Italiano) is an Institute of the C.N.R. with the institutional task of compiling an historical dictionary of the Italian language. At present the researchers of the OVI are working on the first section of this dictionary, called Tesoro della Lingua Italiana delle Origini -(TLIO), i.e. \"Thesaurus of the oldest Italian language\". The main characteristic of the OVI is the identification of the Institute with its task of making an historical Italian dictionary, which is the pivot around which all the other activities revolve. The present-day activity of the OVI is the continuation of a project started by the Accademia della Crusca in 1965 with funding from the C.N.R. This project, a new historical dictionary of Italian, was to be the heir of the glorious \"Vocabolario degli Accademici\", but with the difference of not being prescriptive (i.e. proposing a model for how language should be used), but historically descriptive (i.e. offering documentation of the vocabulary of Italian in the course of its history). From the beginning, the Accademia della Crusca decided to make use of computers to manage the documentation, to a large extent new to the lexicographical tradition. In 1973 the Accademia della Crusca decided to split the projected dictionary in two sections, divided by the symbolical date of 1375, the year of Giovanni Boccaccio's death, and to concentrate the work on the oldest section, which required a different methodology than the more recent section. In 1983 (Italian Law 6.1.1983 n. 6) the staff of the Opera del Vocabolario was transferred to the C.N.R., where the new Centro di studi Opera del Vocabolario Italiano started its activity in 1985. With the recent reorganization of the C.N.R. the Centro di studi became an Institute, retaining its old name and without having to merge with other institutions. The Institute came into being on June 15, 2002. The principal activities are: 1) the compilation of the Tesoro della Lingua Italiana delle Origini (TLIO), which at the end of September 2014 amounts to ca. 29,000 entries published in the Internet; 2) the development, necessary for the dictionary work, of the database of Old Italian texts. This database is also an independent linguistical research tool and is searchable through the Internet; 3) the development of software for lexicographical and linguistical purposes, in particular for the management of textual corpuses similar to the one upon which the TLIO is based. The OVI publishes a yearly \"Bollettino\" (I 1994, II 1997 - XVIII 2013), where readers can find samples of TLIO entries (since volume II), a general index of the entries published on the website (since volume V), and papers on philological subjects (in particular, text editions destined to inclusion in the database) and on subjects of 'computers and the humanities' (on the constitution of the OVI database, on GATTO, on the OVI website dictionary interface). The OVI publishes also a Supplement to the \"Bollettino\" (1 2001; 2 2007; 3 2012; 4 3013). The \"Bollettino\" and his supplement are published by the Edizioni dell'Orso (Alessandria), without any need for financial support from the C.N.R. The OVI personnel is composed in September 2014 by 11 stably employed persons, thus divided: researchers, 8, clerical staff, 2, administrative personnel, 2. To these are added 3 persons on temporary contracts and a number of freelance collaborators. Compared to the staff of other dictionary projects like the \"Trésor de la Langue Française\" or the third edition of the \"Oxford English Dictionary\", the TLIO staff of lexicographers is relatively small. In relation to this, the results must be considered satisfactory. (literal)
Istituto esecutore di
Prodotto
Ha afferente
Codice
  • OVI (literal)
Nome
  • Istituto opera del vocabolario italiano (OVI) (literal)
  • The italian dictionary (OVI) (literal)
Parte di
Afferisce a
Collaborazioni
  • 1) Accademia della Crusca. L’OVI trae origine da un antico progetto dell’Accademia. Attualmente, il rapporto è regolato da una convenzione tra il CNR e l’Accademia (in virtù della quale il CNR finanzia l’Accademia). Le due istituzioni condividono la stessa sede. La biblioteca dell’Accademia è uno strumento fondamentale di lavoro dei lessicografi dell’OVI. L’OVI collabora a progetti e iniziative dell’Accademia (per es. l’OVI ha condotto lo studio preliminare per la marcatura per la realizzazione della “Lessicografia della Crusca in rete”). L’OVI partecipa insieme con l’Accademia alla “Federazione Europea delle Istituzioni Linguistiche Nazionali” per lo studio delle lingue ufficiali europee e la promozione del multilinguismo nell’Unione Europea. Questa collaborazione è motivata dalla convinzione che progetti come quello del TLIO e del Corpus OVI dell’Italiano antico hanno possibilità di sussistere solo entro una politica europea di promozione delle lingue nazionali. 2) Università di Chicago, USA (accordo ItalNet, entro il quale una versione della banca dati testuale dell’OVI è stata implementata online fin dal 1998, molto prima che fosse pronta la versione GattoWeb). 3) Università di Notre Dame, USA (accordo ItalNet). Studenti di dottorato dell’Università di Notre Dame sono stati ospiti dell’OVI e hanno studiato i metodi lessicografici dell’OVI. L’OVI e l’Università di Notre Dame stanno studiando la creazione di un gruppo di ricerca sull’italiano antico (e forse anche di un gruppo di redazione del TLIO) presso l’Università di Notre Dame). 4) Fondazione Ezio Franceschini, Firenze (realizzazione di LirIO, una banca dati testuale della poesia italiana del Medioevo in CD-ROM). 5) Archivio di Stato di Prato. L’OVI ha realizzato una banca dati testuale lemmatizzata delle lettere edite dell’Archivio di Francesco di Marco Datini, attualmente interrogabile online (http://aspweb.ovi.cnr.it). 6) Università di Firenze. L’OVI ha partecipato alla creazione del CLIEO (Centro di Linguistica Storica e Teorica: Italiano, Lingue Europee, Lingue Orientali), di cui è membro. 7) Università della Basilicata (stages di studenti di dottorato, per la redazione del TLIO). 8) Università per Stranieri di Siena (stages di studenti di dottorato, per la redazione del TLIO). 9) Università di Zurigo (collaborazione nell’ambito degli studi di Italiano antico e nella redazione del TLIO). (literal)
Attività di formazione
  • Stages di dottorato (Università della Basilicata, Università per Stranieri di Siena; altre convenzioni in fase di preparazione). (literal)
Http://www.cnr.it/ontology/cnr/localizzazione.owl#via
  • Via di Castello, 46 (literal)
Cap
  • 50141 (literal)
Città
  • Firenze (literal)
Http://www.cnr.it/ontology/cnr/localizzazione.owl#provincia
  • FI (literal)
Telefono
  • 055452841 (literal)
Codice CDS
  • 062 (literal)
Servizi
  • Le banche dati testuali dell’OVI (principalmente il Corpus OVI dell’italiano antico) sono interrogabili online con accesso libero e gratuito. Il TLIO è pubblicato online in corso d’opera Cfr. nel sito dell’OVI una lista di citazioni di lavori scientifici che se ne sono serviti. Il software GATTO prodotto dall’OVI è scaricabile liberamente dalla rete (più di 3000 copie scaricate). L’OVI fornisce assistenza a gruppi di ricerca che producono banche dati testuali; cfr. il Corpus ARTESIA (Archivio Testuale del Siciliano Antico) dell’Università di Catania, creato in GATTO e ora interrogabile sul server dell’OVI in GattoWeb. (literal)
Competenze
  • Competenze linguistiche (lessicografia italiana, storia della lingua italiana, grammatica storica italiana), filologiche e informatiche (in particolare nel campo dell'informatica umanistica). (literal)
Email
  • mailto:ovi@ovi.cnr.it (literal)
  • ovi@ovi.cnr.it (literal)
Indirizzo
  • Via di Castello, 46 - 50141 Firenze (FI) (literal)
Direttore
Missione
  • L'Opera del Vocabolario Italiano è l'Istituto del CNR che ha il compito di elaborare il vocabolario storico italiano, nella fase attuale il vocabolario storico dell'italiano antico (\"Tesoro della Lingua Italiana delle Origini\"), che viene pubblicato online in corso d'opera (www.vocabolario.org). Lo svolgimento di tale compito comporta l'elaborazione di banche dati testuali informatizzate, accessibili online (in particolare, ma non solo, il \"Corpus OVI dell'Italiano antico\", stesso indirizzo) e la creazione e lo sviluppo di software specifico. Nel lungo termine l'OVI si propone il compito di redigere anche le sezioni cronologiche successive del vocabolario storico (fino al secolo XX) e di aggiornare e sviluppare vocabolario, banche dati e software al passo con i progressi della ricerca filologica, storico-linguistica e informatica. (literal)
Attività di ricerca
  • 1) Redazione del Tesoro della Lingua Italiana delle Origini (TLIO). Il TLIO è un dizionario di prima mano, compilato direttamente sui testi raccolti nelle banche dati dell’OVI. Le norme di redazione sono state elaborate negli anni 1996-97 e pubblicate nel Bollettino dell’OVI, III (1998) e nel sito dell’OVI (nel corso degli anni sono state modificate in alcuni aspetti formali; la versione aggiornata è edita nel sito dell’OVI). La redazione è stata iniziata negli stessi anni, è giunta a 1000 voci alla fine del 1998 e ha proceduto dal 1999 al 2006 a un ritmo di 2000 nuove voci per anno, ridotte a 1000 per anno nel 2007 e 2008, per insufficienza delle risorse. Dal 2009 si è ripreso il ritmo consueto. La dimensione finale è prevista in circa 50.000 voci. Il TLIO è pubblicato in rete in corso d'opera nel sito dell'OVI. Il sistema attuale di consultazione consente, oltre all'accesso dall'indice generale, la ricerca per voci e per forme grafiche (ricerca delle voci sotto le quali sono raccolte determinate forme grafiche), con varie opzioni e con in più la ricerca di testo libero nelle definizioni. Le voci sono firmate, e una funzione di ricerca consente di elencare tutte le voci firmate da un dato redattore. È in corso di elaborazione un nuovo sistema integrato di editing e di interrogazione in rete delle voci, che porterà ad un vocabolario totalmente strutturato. 2) Costituzione, sviluppo e manutenzione di banche dati testuali. La più importante è il Corpus OVI dell’Italiano antico, che è il corpus di riferimento per la redazione del TLIO ed è al tempo stesso uno strumento di ricerca linguistica autonomo, consultabile online; al settembre del 2014, contiene 23.173.522 occorrenze in 2318 testi (467.542 forme grafiche distinte). È formato di due parti consultabili anche separatamente: (a) Corpus TLIO, lemmatizzato, base della redazione del TLIO, che contiene 21.868.399 occorrenze in 1998 testi (444.011 forme grafiche distinte); (b) Corpus TLIO aggiuntivo, non lemmatizzato, usato per integrare le voci del TLIO, che contiene 1.305.828 occorrenze in 320 testi. Vi vengono inclusi, indicizzati e resi interrogabili tutti i testi disponinili in edizioni affidabili scritti in qualsiasi varietà dell’italiano prima del 1375 (o databili entro il Trecento). Non sistematicamente vi vengono inclusi anche testi dell’inizio del Quattrocento, testi in edizioni insoddisfacenti ma la cui esclusione creerebbe lacune ancor più dannose (vengono comunque marcati in modo da mettere in guardia il lettore), e testi in altre varietà linguistiche (per es. in friulano o in dialetti galloromanzi) che si ritengono utili per lo studio dell’italiano antico. La banca dati è parzialmente lemmatizzata (3.654.962 occorrenze lemmatizzate); il lavoro di lemmatizzazione procede accanto alla redazione del TLIO. 3) Elaborazione e sviluppo di software per la ricerca lessicografica e linguistica, in particolare per la gestione di corpora testuali di struttura analoga al Corpus OVI dell’Italiano antico. In particolare, GATTO (versione 3.3, la versione 4 è in elaborazione) consente di creare, modificare e gestire banche dati testuali (cioè contenenti testi integrali), e di introdurre una lemmatizzazione a più livelli (lemmi e ‘iperlemmi’); GattoWeb consente di rendere interrogabili online corpora creati con GATTO. L’OVI sta elaborando un nuovo strumento per la redazione e la pubblicazione online di dizionari del tipo del TLIO (il software con il quale questo è attualmente edito in rete è anch’esso dell’OVI). Si conducono ricerche sulla lemmatizzazione automatica rivolte ai problemi specifici dei testi italiani antichi. (literal)
Unità organizzativa di supporto

Incoming links:


Prodotto di
Afferisce a
Istituto esecutore
Ha afferente
Descrizione di
Direttore di
Unità organizzativa di supporto in
Has part
data.CNR.it