• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

±¹³» ³í¹®Áö

Ȩ Ȩ > ¿¬±¸¹®Çå > ±¹³» ³í¹®Áö > Çѱ¹Á¤º¸°úÇÐȸ ³í¹®Áö > Á¤º¸°úÇÐȸ ³í¹®Áö B : ¼ÒÇÁÆ®¿þ¾î ¹× ÀÀ¿ë

Á¤º¸°úÇÐȸ ³í¹®Áö B : ¼ÒÇÁÆ®¿þ¾î ¹× ÀÀ¿ë

Current Result Document : 12 / 14 ÀÌÀü°Ç ÀÌÀü°Ç   ´ÙÀ½°Ç ´ÙÀ½°Ç

ÇѱÛÁ¦¸ñ(Korean Title) °¡ÁßÄ¡°¡ ºÎ¿©µÈ º£ÀÌÁö¾È ºÐ·ùÀÚ¸¦ ÀÌ¿ëÇÑ ½ºÆÔ ¸ÞÀÏ ÇÊÅ͸µ ½Ã½ºÅÛ
¿µ¹®Á¦¸ñ(English Title) Spam-Mail Filtering System Using Weighted Bayesian Classifier
ÀúÀÚ(Author) ±èÇöÁØ   Á¤ÀçÀº   Á¶±Ù½Ä  
¿ø¹®¼ö·Ïó(Citation) VOL 31 NO. 08 PP. 1092 ~ 1100 (2004. 08)
Çѱ۳»¿ë
(Korean Abstract)
ÃÖ±Ù ÀÎÅͳÝÀÇ ±Þ¼ÓÇÑ ¼ºÀå°ú ´õºÒ¾î ÀüÀÚ¸ÞÀÏ(E-Mail)Àº Åë½Å ¹× Á¤º¸, Àǻ米ȯÀÇ ÇʼöÀûÀΠ¸Åü·Î »ç¿ë µÇ¾îÁö°í ÀÖ´Ù. ±×·¯³ª Æí¸®ÇÏ°í ºñ¿ëÀÌ µéÁö ¾Ê´Â ÀåÁ¡À» ÀÌ¿ëÇØ ¾öû³­ ¾çÀÇ ½ºÆÔ ¸ÞÀÏÀÌ ¸ÅÀÏ°°ÀÌ ½ñ¾ÆÁ® ¿À°í, ±× ¹®Á¦ÀÇ ½É°¢¼º¿¡ Á¤º¸Åë½ÅºÎ´Â ¢¥Á¤º¸Åë½Å¸Á ÀÌ¿ëÃËÁø ¹× Á¤º¸º¸È£µî¿¡ °üÇÑ °³Á¤¾È¢¥À̶ó´Â »õ·Î¿î ¹ý·ü±îÁö ¸¸µé¾ú´Ù. º» ³í¹®¿¡¼­´Â ±âÁ¸ÀÇ ¹®¼­ ºÐ·ù¿¡ ³Î¸® ¾²ÀÌ´ø ³ªÀ̺꠺£ÀÌÁö¾È ºÐ·ùÀÚ(naive Bayesian classifier)º¸´Ù °³¼±µÈ °¡ÁßÄ¡°¡ ºÎ¿©µÈ º£ÀÌÁö¾È ºÐ·ùÀÚ (weighted Bayesian classifier)¿Í Á¤º¸Åë½ÅºÎÀÇ °³Á¤¾ÈÀ» ÁؼöÇϴ ¸ÞÀÏÀ» ºÐ·ùÇϱâ À§ÇÑ Àü󸮠´Ü°è, ±×¸®°í »ç¿ëÀÚÀÇ ÇൿÀ» ÇнÀÇÏ¿© º¸´Ù Á¤È®ÇÑ ºÐ·ù¸¦ °¡´ÉÇÏ°Ô Áö´ÉÇü ¿¡ÀÌÁ¯Æ®(intelligent agent)°¡ °áÇյȠÇüÅÂÀÇ ½ºÆÔ ¸ÞÀÏ ÇÊÅ͸µ ½Ã½ºÅÛ(spam mail filtering system)À» Á¦¾ÈÇÑ´Ù. Á¦¾ÈµÈ ½Ã½ºÅÛ¿¡¼­´Â »ç¿ëÀÚ°¡ Á÷Á¢ ±ÔÄ¢À» ³ÖÀ» ÇÊ¿ä ¾øÀÌ ÇнÀÇÑ µ¥ÀÌŸ¸¦ °¡Áö°í ÀÚµ¿ÀûÀ¸·Î ½ºÆÔ ¸ÞÀÏÀ» ºÐ·ùÇÒ ¼ö°¡ Àִµ¥, Æ¯È÷ À̸ÞÀÏÀǠƯ¡ ÃßÃâ(feature extraction)À» ÀÌ¿ëÇÏ¿© »ó´ëÀûÀ¸·Î ½ºÆÔ/³í½ºÆÔ ÆǺ°¿¡ ºñÁßÀÌ Å« ´Ü¾îµé¿¡ ´ëÇØ °¡ÁßÄ¡¸¦ ºÎ¿©ÇÔÀ¸·Î¼­ ÇÊÅ͸µÀÇ ¼º´ÉÇâ»óÀ» µµ¸ðÇÏ¿´´Ù. ½ÇÇè¿¡¼­´Â Á¦¾ÈµÈ ½Ã½ºÅÛÀÇ ÃÖÀûÀÇ ¼º´É Æò°¡¸¦ À§Çؼ­ ÀϹݠ³ªÀ̺꠺£ÀÌÁö¾È ÇÊÅ͸µ½ÃÀÇ ¼º´É°ú À̸ÞÀÏ Çì´õÁ¤º¸, Æ¯Á¤ Tagµé ±×¸®°í ÇÏÀÌÆÛ¸µÅ© ºÎºÐ¿¡ °¡ÁßÄ¡¸¦ ÁØ º£ÀÌÁö¾È ÇÊÅ͸µ, ¸¶Áö¸·À¸·Î 4°¡Áö¸¦ °áÇÕÇÑ »óÅÂÀÇ ÇÊÅ͸µ ¼º´ÉÀ» °¢°¢ ºñ±³ ºÐ¼®ÇÏ¿´´Ù. ±× °á°ú Á¦¾ÈÇϴ ½Ã½ºÅÛÀÌ ³ªÀ̺꠺£ÀÌÁö¾È ºÐ·ùÀÚ¸¦ ÀÌ¿ëÇÑ ½Ã½ºÅÛº¸´Ù Á¤È®µµ¿¡¼­´Â 5.7% ÀúÁ¶ÇÑ ¼º´ÉÀ» º¸¿´À¸³ª, ÀçÇöÀ²¿¡¼­ 33.3%, F-measure¿¡¼­ 31.2% ¿ì¼öÇÑ ¼º´ÉÇâ»óÀ» º¸¿´´Ù.
¿µ¹®³»¿ë
(English Abstract)
An E-mails have regarded as one of the most popular methods for exchanging information because of easy usage and low cost. Meanwhile, exponentially growing unwanted mails in user´s mailbox have been raised as main problem. Recognizing this issue, Korean government established a law in order to prevent e-mail abuse. In this paper we suggest hybrid spam mail filtering system using weighted Bayesian classifier which is extended from naive Bayesian classifier by adding the concept of preprocessing and intelligent agents. This system can classify spam mails automatically by using training data without manual definition of message rules. Particularly, we improved filtering efficiency by imposing weight on some character by feature extraction from spam mails. Finally, we show efficiency comparison among four cases - naive Bayesian, weighting on e-mail header, weighting on HTML tags, weighting on hyperlinks and combining all of four cases. As compared with naive Bayesian classifier, the proposed system obtained 5.7% decresed precision, while the recall and F-measure of this system increased by 33.3% and 31.2%, respectively.
Å°¿öµå(Keyword) Á¤º¸°Ë»ö   º£ÀÌÁö¾È ºÐ·ùÀÚ   ¸ÞÀÏ ÇÊÅ͸µ   Áö´ÉÇü ¿¡ÀÌÁ¯Æ®   Bayesian Classifier   Mail filtering   Intelligent Agent  
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå