• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

Çмú´ëȸ ÇÁ·Î½Ãµù

Ȩ Ȩ > ¿¬±¸¹®Çå > Çмú´ëȸ ÇÁ·Î½Ãµù > Çѱ¹Á¤º¸°úÇÐȸ Çмú´ëȸ > KSC 2019

KSC 2019

Current Result Document :

ÇѱÛÁ¦¸ñ(Korean Title) ¸ÖƼ ¿¡ÀÌÀüÆ® ȯ°æ¿¡¼­ ´Ù¾çÇÑ Àü·«¿¡ °­ÀÎÇÑ ¸ÖƼ½ºÅ³ °­È­ÇнÀ ¿¡ÀÌÀüÆ® ¼³°è °¡´É¼º ¿¬±¸
¿µ¹®Á¦¸ñ(English Title) On the design of multi-skilled reinforcement learning agents robustly coping with contextual changes in the environments
ÀúÀÚ(Author) À̹ÎÁö   À忹¿ø   Á¶¼ö¿¬   ÁÖÇ϶÷   Minji Lee   Yewon Jang   Suyeon Cho   Haram Joo  
¿ø¹®¼ö·Ïó(Citation) VOL 46 NO. 02 PP. 1785 ~ 1787 (2019. 12)
Çѱ۳»¿ë
(Korean Abstract)
ȯ°æ Á¤º¸ ÇнÀ ¾øÀÌ °æÇè¿¡ ÀÇÁ¸ÇÏ¿© ÇнÀÇÏ´Â Model-free °­È­ÇнÀ ¿¡ÀÌÀüÆ®´Â, ºü¸¥ ÀÇ»ç °áÁ¤À» ÅëÇØ ³ôÀº È¿À²À» º¸ÀÌ´Â ¹Ý¸é, ȯ°æÀÌ º¯Çϰųª ´Ù¾çÇÑ »ó´ë Àü·«ÀÌ Á¸ÀçÇÏ´Â °æ¿ì º¯È­¿¡ À¯¿¬ÇÏ°Ô ´ëÀÀÇÏÁö ¸øÇÏ°í ÀÇ»ç °áÁ¤ ´É·ÂÀÌ ±Þ°ÝÇÏ°Ô ÀúÇϵǴ ´ÜÁ¡ÀÌ ÀÖ´Ù. ±×·¯³ª, Àΰ£ µÎ³ú´Â model-free»Ó¸¸ ¾Æ´Ï¶ó ȯ°æ Á¤º¸¸¦ ÇнÀÇÏ¿© °èȹÀ» ±â¹ÝÀ¸·Î ÀÇ»ç°áÁ¤À» ¼öÇàÇÏ´Â Model-based °­È­ÇнÀµµ À¯¿¬ÇÏ°Ô »ç¿ëÇÏ¿© ȯ°æ º¯È­¿¡ ´ëÇØ °­ÀÎÇÏ°Ô ´ëÀÀÇϸ鼭 ³ôÀº È¿À²µµ À¯ÁöÇÏ´Â ¸ÞÄ¿´ÏÁòÀ» º¸À¯ÇÏ°í ÀÖ´Ù. º» ³í¹®Àº Àΰ£µÎ³úÀÇ model-based °­È­ÇнÀÀ» ¸ð¹æÇÑ °­È­ÇнÀ ¿¡ÀÌÀüÆ®¸¦ ¼³°èÇÏ°í, À̸¦ ÅëÇØ °ÔÀÓ È¯°æ¿¡¼­ ´Ù¾çÇÑ »ó´ë ¹× Àü·« º¯È­¿¡ °­ÀÎÇÑ ¸ÖƼ½ºÅ³ °­È­ÇнÀ ¿¡ÀÌÀüÆ® ¼³°è °¡´É¼ºÀ» È®ÀÎÇÏ°íÀÚ ÇÑ´Ù. À̸¦ À§ÇØ LSTM Embedded DQN (LED) ±¸Á¶¸¦ ÅëÇØ »ó´ë¹æ Àü·« º¯È­¿¡ µû¸¥ ȯ°æ »óÅ º¯È­¸¦ ¿¹ÃøÇÏ°í, À̸¦ DQNÀÇ ÀÇ»ç°áÁ¤¿¡ ¹Ý¿µÇÏ¿© º¯È­ÇÏ´Â »ó´ë ¿¡ÀÌÀüÆ® Àü·«¿¡ ¿ìÀ§¸¦ Á¡ÇÒ ¼ö ÀÖ´Â ¸ÖƼ½ºÅ³ °­È­ÇнÀ ¿¡ÀÌÀüÆ®¸¦ Á¦¾ÈÇÏ¿´´Ù. LED ¿¡ÀÌÀüÆ®´Â »ó´ë¿òÁ÷ÀÓ ÁÂÇ¥¸¦ ¿¹ÃøÇÏ´Â LSTM ³×Æ®¿öÅ© ÁýÇÕ°ú À̵éÀ» °ü¸®ÇÏ´ÂRegulator, ±×¸®°í ÇൿÀ» °áÁ¤ÇÏ´Â DQN ³×Æ®¿öÅ©·Î ÀÌ·ç¾îÁ®ÀÖ´Ù. LED ¿¡ÀÌÀüÆ®´Â 5°³ÀÇ ¼­·Î ´Ù¸¥ »ó´ë¿Í Atari PongÀ» ¼öÇàÇßÀ» ¶§, »ó´ë Àü·«¿¡ ÀÇÇÑ È¯°æ »óÅ º¯È­¸¦ ¿¹ÃøÇÒ ¼ö ÀÖµµ·Ï ¼º°øÀûÀ¸·Î ÇнÀµÇ¾úÀ¸¸ç, À̸¦ ÅëÇØ »ó´ë¹æÀÇ Àü·«ÀÌ º¯°æµÇ¾úÀ» ¶§¿¡µµ º¯È­¿¡ ´ëÀÀÇÏ´Â À¯¿¬ÇÑ Àü·«À» ¼ö¸³, ºñ±³ ¸ðµ¨¿¡ ºñÇØ ³ôÀº ´©Àû º¸»ó ¼öÄ¡¸¦ º¸¿´´Ù.
¿µ¹®³»¿ë
(English Abstract)
Å°¿öµå(Keyword)
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå