Un sistema per la ricerca di duplicati in basi di dati anagrafiche (Risultati di valorizzazione applicativa)

Type
Label
  • Un sistema per la ricerca di duplicati in basi di dati anagrafiche (Risultati di valorizzazione applicativa) (literal)
Anno
  • 2006-01-01T00:00:00+01:00 (literal)
Alternative label
  • Francesco Folino, Giuseppe Manco (2006)
    Un sistema per la ricerca di duplicati in basi di dati anagrafiche
    (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
  • Francesco Folino, Giuseppe Manco (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#proprieta
  • ICAR-CNR (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#riferimentiUtilizzatori
  • Il sistema è utilizzabile nei contesti in cui dati provenienti da svariate sorgenti eterogenee vanno riconciliate. Di fatto, il sistema permette di riconoscere e armonizzare duplicati presenti in una tabella di un database. In particolare, il sistema è particolarmente efficace nel riconoscere tuple sintatticamente differenti, ma semanticamente riferite alla stessa entità. I contesti applicativi nei quali il sistema può essere utilizzato proficuamente sono molteplici e in genere si riferiscono alla fase di pulizia dei dati nel caricamento in un data warehouse: ad esempio, armonizzazione di un database di indirizzi, di riferimenti bibliografici, ecc. (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
  • ICAR-CNR (literal)
Titolo
  • Un sistema per la ricerca di duplicati in basi di dati anagrafiche (literal)
Descrizione sintetica
  • Il sistema utilizza una tecnica incrementale per la ricerca di duplicati. In pratica, viene costruito un indice basato su chiavi hash che permette di associare tupla ad un bucket. La particolarità è che la chiave hash utilizzata permette di associare duplicati nello stesso bucket. Di conseguenza, la scansione dell’indice permette di identificare i duplicati. Il sistema è scritto in Java ed implementa una tecnica di hashing gerarchica basata sulla nozione di minwise independent permutation. (literal)
Prodotto di
Autore CNR
Insieme di parole chiave

Incoming links:


Prodotto
Autore CNR di
Insieme di parole chiave di
data.CNR.it