• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

±¹³» ÇÐȸÁö

Ȩ Ȩ > ¿¬±¸¹®Çå > ±¹³» ÇÐȸÁö > µ¥ÀÌÅͺ£À̽º ¿¬±¸È¸Áö(SIGDB)

µ¥ÀÌÅͺ£À̽º ¿¬±¸È¸Áö(SIGDB)

Current Result Document : 1 / 1

ÇѱÛÁ¦¸ñ(Korean Title) WWW ȯ°æ¿¡¼­ Áߺ¹¹®¼­ÀÇ °ËÃâ ±â¹ý¿¡ ´ëÇÑ °íÂû
¿µ¹®Á¦¸ñ(English Title) A Survey on Detecting Duplicate Documents in World Wide Web Environment
ÀúÀÚ(Author) À̼øÇà   Soon-Haeng Lee   ÀÌ»óö   Sang-Chul Lee   ±è»ó¿í   Sang-Wook Kim   ±èÇÐÁø   Hak-Jin Kim  
¿ø¹®¼ö·Ïó(Citation) VOL 25 NO. 01 PP. 0001 ~ 0017 (2009. 04)
Çѱ۳»¿ë
(Korean Abstract)
ÃÖ±Ù µé¾î À¥ ¹®¼­°¡ Áõ°¡ÇÔ¿¡ µû¶ó Áߺ¹¹®¼­ °ËÃâÀÇ Á߿伺ÀÌ Á¡Â÷ Ä¿Áö°í ÀÖ´Ù. º» ³í¹®¿¡¼­´Â WWW È¯°æ¿¡¼­ Áߺ¹¹®¼­¸¦ °ËÃâÇϴ ±â¹ý¿¡ °ü·ÃµÈ ±âÁ¸ÀÇ ¿¬±¸ ÇöȲ¿¡ ´ëÇÏ¿© ¼Ò°³ÇÑ´Ù. ¸ÕÀú, µÎ °³ÀÇ ¹®¼­°¡ ÁÖ¾îÁ³À» ¶§ Áߺ¹ÀÎÁöÀÇ ¿©ºÎ¸¦ ÆÇÁ¤Çϴ ±â¹ýµéÀ» ¼Ò°³ÇÑ´Ù. µÎ ¹ø°·Î´Â ´ë¿ë·®ÀÇ ¹®¼­ µ¥ÀÌÅͺ£À̽º¿¡¼­ Áߺ¹¹®¼­µéÀ» È¿À²ÀûÀ¸·Î °ËÃâÇϴ ±â¹ýµé¿¡ ´ëÇØ ³íÇÑ´Ù. ¸¶Áö¸·À¸·Î ÇâÈÄ ¿¬±¸ ¹æÇâ¿¡ ´ëÇÏ¿© Á¦½ÃÇÑ´Ù.
¿µ¹®³»¿ë
(English Abstract)
Recently, as the number of documents in the WWW(World Wide Web) increases, it becomes crucial to treat duplicate documents. In this article, we survey previous research results related to handling duplicate documents in WWW environment. First, we introduce a variety of methods for determining whether given two documents are duplicated. Second, we address methods for detecting duplicate documents efficiently from a large document database. Finally, we suggest further research directions.
Å°¿öµå(Keyword) Áߺ¹¹®¼­°ËÃâ   µ¥ÀÌÅͺ£À̽º   µ¥ÀÌÅ͸¶ÀÌ´×   Duplicate document detection   Database   Data mining  
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå