http://www.cnr.it/ontology/cnr/individuo/prodotto/ID174288

An Incremental Clustering Scheme for Duplicate Detection in Large Database (Contributo in atti di convegno)

Type

Label

An Incremental Clustering Scheme for Duplicate Detection in Large Database (Contributo in atti di convegno) (literal)

Anno

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#doi

Alternative label

Eugenio Cesario; Francesco Folino; Giuseppe Manco; Luigi Pontieri (2005)
An Incremental Clustering Scheme for Duplicate Detection in Large Database
in 9th International Database Engineering and Applications Symposium (IDEAS'05), Montreal, Canada, 25-27 July 2005
(literal)

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori

Pagina inizio

Pagina fine

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#url

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#titoloVolume

9th International Database Engineering & Application Symposium, Proceedings (literal)

Note

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni

Istituto di calcolo e reti ad alte prestazioni; Istituto di calcolo e reti ad alte prestazioni; Istituto di calcolo e reti ad alte prestazioni; Istituto di calcolo e reti ad alte prestazioni (literal)

Titolo

An Incremental Clustering Scheme for Duplicate Detection in Large Database (literal)

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#isbn

Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#curatoriVolume

Abstract

We propose an incremental algorithm for clustering duplicate tuples in large databases, which allows to assign any new tuple t to the cluster containing the database tuples which are most similar to t (and hence are likely to refer to the same real-world entity t is associated with). The core of the approach is a hash-based indexing technique that tends to assign highly similar objects to the same buckets. Empirical evaluation proves that the proposed method allows to gain considerable efficiency improvement over a state-ofart index structure for proximity searches in metric spaces. (literal)

Editore

Prodotto di

Autore CNR

Prodotto

Autore CNR di

Editore di

data.CNR.it