• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

¿µ¹® ³í¹®Áö

Ȩ Ȩ > ¿¬±¸¹®Çå > ¿µ¹® ³í¹®Áö > TIIS (Çѱ¹ÀÎÅͳÝÁ¤º¸ÇÐȸ)

TIIS (Çѱ¹ÀÎÅͳÝÁ¤º¸ÇÐȸ)

Current Result Document : 1 / 1

ÇѱÛÁ¦¸ñ(Korean Title) Guiding Practical Text Classification Framework to Optimal State in Multiple Domains
¿µ¹®Á¦¸ñ(English Title) Guiding Practical Text Classification Framework to Optimal State in Multiple Domains
ÀúÀÚ(Author) Sung-Pil Choi   Sung-Hyon Myaeng   Hyun-Yang Cho  
¿ø¹®¼ö·Ïó(Citation) VOL 03 NO. 03 PP. 0285 ~ 0308 (2009. 06)
Çѱ۳»¿ë
(Korean Abstract)
¿µ¹®³»¿ë
(English Abstract)
This paper introduces DICE, a Domain-Independent text Classification Engine. DICE is robust, efficient, and domain-independent in terms of software and architecture. Each module of the system is clearly modularized and encapsulated for extensibility. The clear modular architecture allows for simple and continuous verification and facilitates changes in multiple cycles, even after its major development period is complete. Those who want to make use of DICE can easily implement their ideas on this test bed and optimize it for a particular domain by simply adjusting the configuration file. Unlike other publically available tool kits or development environments targeted at general purpose classification models, DICE specializes in text classification with a number of useful functions specific to it. This paper focuses on the ways to locate the optimal states of a practical text classification framework by using various adaptation methods provided by the system such as feature selection, lemmatization, and classification models.
Å°¿öµå(Keyword) Document classification   test bed   machine learning   text categorization   feature selection   text mining   lemmatization  
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå