http://www.cnr.it/ontology/cnr/individuo/prodotto/ID151077
Un sistema per la ricerca di duplicati in basi di dati anagrafiche (Risultati di valorizzazione applicativa)
- Type
- Label
- Un sistema per la ricerca di duplicati in basi di dati anagrafiche (Risultati di valorizzazione applicativa) (literal)
- Anno
- 2006-01-01T00:00:00+01:00 (literal)
- Alternative label
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
- Francesco Folino, Giuseppe Manco (literal)
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#proprieta
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#riferimentiUtilizzatori
- Il sistema è utilizzabile nei contesti in cui dati provenienti da svariate sorgenti eterogenee vanno riconciliate. Di fatto, il sistema permette di riconoscere e armonizzare duplicati presenti in una tabella di un database. In particolare, il sistema è particolarmente efficace nel riconoscere tuple sintatticamente differenti, ma semanticamente riferite alla stessa entità. I contesti applicativi nei quali il sistema può essere utilizzato proficuamente sono molteplici e in genere si riferiscono alla fase di pulizia dei dati nel caricamento in un data warehouse: ad esempio, armonizzazione di un database di indirizzi, di riferimenti bibliografici, ecc.
(literal)
- Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
- Titolo
- Un sistema per la ricerca di duplicati in basi di dati anagrafiche (literal)
- Descrizione sintetica
- Il sistema utilizza una tecnica incrementale per la ricerca di duplicati. In pratica, viene costruito un indice basato su chiavi hash che permette di associare tupla ad un bucket. La particolarità è che la chiave hash utilizzata permette di associare duplicati nello stesso bucket. Di conseguenza, la scansione dellindice permette di identificare i duplicati. Il sistema è scritto in Java ed implementa una tecnica di hashing gerarchica basata sulla nozione di minwise independent permutation.
(literal)
- Prodotto di
- Autore CNR
- Insieme di parole chiave
Incoming links:
- Prodotto
- Autore CNR di
- Insieme di parole chiave di