An Incremental Clustering Scheme for Duplicate Detection in Large Database (Contributo in atti di convegno)

Type
Label
  • An Incremental Clustering Scheme for Duplicate Detection in Large Database (Contributo in atti di convegno) (literal)
Anno
  • 2005-01-01T00:00:00+01:00 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#doi
  • 10.1109/IDEAS.2005.10 (literal)
Alternative label
  • Eugenio Cesario; Francesco Folino; Giuseppe Manco; Luigi Pontieri (2005)
    An Incremental Clustering Scheme for Duplicate Detection in Large Database
    in 9th International Database Engineering and Applications Symposium (IDEAS'05), Montreal, Canada, 25-27 July 2005
    (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#autori
  • Eugenio Cesario; Francesco Folino; Giuseppe Manco; Luigi Pontieri (literal)
Pagina inizio
  • 89 (literal)
Pagina fine
  • 95 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#url
  • http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1540899 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#titoloVolume
  • 9th International Database Engineering & Application Symposium, Proceedings (literal)
Note
  • ISI Web of Science (WOS) (literal)
  • ACM DL (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#affiliazioni
  • Istituto di calcolo e reti ad alte prestazioni; Istituto di calcolo e reti ad alte prestazioni; Istituto di calcolo e reti ad alte prestazioni; Istituto di calcolo e reti ad alte prestazioni (literal)
Titolo
  • An Incremental Clustering Scheme for Duplicate Detection in Large Database (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#isbn
  • 0-7695-2404-4 (literal)
Http://www.cnr.it/ontology/cnr/pubblicazioni.owl#curatoriVolume
  • Desai, BC and Vossen, G (literal)
Abstract
  • We propose an incremental algorithm for clustering duplicate tuples in large databases, which allows to assign any new tuple t to the cluster containing the database tuples which are most similar to t (and hence are likely to refer to the same real-world entity t is associated with). The core of the approach is a hash-based indexing technique that tends to assign highly similar objects to the same buckets. Empirical evaluation proves that the proposed method allows to gain considerable efficiency improvement over a state-ofart index structure for proximity searches in metric spaces. (literal)
Editore
Prodotto di
Autore CNR

Incoming links:


Prodotto
Autore CNR di
Editore di
data.CNR.it