KSC 2019
Current Result Document :
ÇѱÛÁ¦¸ñ(Korean Title) |
¸ÖƼ ¿¡ÀÌÀüÆ® ȯ°æ¿¡¼ ´Ù¾çÇÑ Àü·«¿¡ °ÀÎÇÑ ¸ÖƼ½ºÅ³ °ÈÇнÀ ¿¡ÀÌÀüÆ® ¼³°è °¡´É¼º ¿¬±¸ |
¿µ¹®Á¦¸ñ(English Title) |
On the design of multi-skilled reinforcement learning agents robustly coping with contextual changes in the environments |
ÀúÀÚ(Author) |
À̹ÎÁö
À忹¿ø
Á¶¼ö¿¬
ÁÖÇ϶÷
Minji Lee
Yewon Jang
Suyeon Cho
Haram Joo
|
¿ø¹®¼ö·Ïó(Citation) |
VOL 46 NO. 02 PP. 1785 ~ 1787 (2019. 12) |
Çѱ۳»¿ë (Korean Abstract) |
ȯ°æ Á¤º¸ ÇнÀ ¾øÀÌ °æÇè¿¡ ÀÇÁ¸ÇÏ¿© ÇнÀÇÏ´Â Model-free °ÈÇнÀ ¿¡ÀÌÀüÆ®´Â, ºü¸¥ ÀÇ»ç °áÁ¤À» ÅëÇØ ³ôÀº È¿À²À» º¸ÀÌ´Â ¹Ý¸é, ȯ°æÀÌ º¯Çϰųª ´Ù¾çÇÑ »ó´ë Àü·«ÀÌ Á¸ÀçÇÏ´Â °æ¿ì º¯È¿¡ À¯¿¬ÇÏ°Ô ´ëÀÀÇÏÁö ¸øÇÏ°í ÀÇ»ç °áÁ¤ ´É·ÂÀÌ ±Þ°ÝÇÏ°Ô ÀúÇϵǴ ´ÜÁ¡ÀÌ ÀÖ´Ù. ±×·¯³ª, Àΰ£ µÎ³ú´Â model-free»Ó¸¸ ¾Æ´Ï¶ó ȯ°æ Á¤º¸¸¦ ÇнÀÇÏ¿© °èȹÀ» ±â¹ÝÀ¸·Î ÀÇ»ç°áÁ¤À» ¼öÇàÇÏ´Â Model-based °ÈÇнÀµµ À¯¿¬ÇÏ°Ô »ç¿ëÇÏ¿© ȯ°æ º¯È¿¡ ´ëÇØ °ÀÎÇÏ°Ô ´ëÀÀÇÏ¸é¼ ³ôÀº È¿À²µµ À¯ÁöÇÏ´Â ¸ÞÄ¿´ÏÁòÀ» º¸À¯ÇÏ°í ÀÖ´Ù. º» ³í¹®Àº Àΰ£µÎ³úÀÇ model-based °ÈÇнÀÀ» ¸ð¹æÇÑ °ÈÇнÀ ¿¡ÀÌÀüÆ®¸¦ ¼³°èÇÏ°í, À̸¦ ÅëÇØ °ÔÀÓ È¯°æ¿¡¼ ´Ù¾çÇÑ »ó´ë ¹× Àü·« º¯È¿¡ °ÀÎÇÑ ¸ÖƼ½ºÅ³ °ÈÇнÀ ¿¡ÀÌÀüÆ® ¼³°è °¡´É¼ºÀ» È®ÀÎÇÏ°íÀÚ ÇÑ´Ù. À̸¦ À§ÇØ LSTM Embedded DQN (LED) ±¸Á¶¸¦ ÅëÇØ »ó´ë¹æ Àü·« º¯È¿¡ µû¸¥ ȯ°æ »óÅ º¯È¸¦ ¿¹ÃøÇÏ°í, À̸¦ DQNÀÇ ÀÇ»ç°áÁ¤¿¡ ¹Ý¿µÇÏ¿© º¯ÈÇÏ´Â »ó´ë ¿¡ÀÌÀüÆ® Àü·«¿¡ ¿ìÀ§¸¦ Á¡ÇÒ ¼ö ÀÖ´Â ¸ÖƼ½ºÅ³ °ÈÇнÀ ¿¡ÀÌÀüÆ®¸¦ Á¦¾ÈÇÏ¿´´Ù. LED ¿¡ÀÌÀüÆ®´Â »ó´ë¿òÁ÷ÀÓ ÁÂÇ¥¸¦ ¿¹ÃøÇÏ´Â LSTM ³×Æ®¿öÅ© ÁýÇÕ°ú À̵éÀ» °ü¸®ÇÏ´ÂRegulator, ±×¸®°í ÇൿÀ» °áÁ¤ÇÏ´Â DQN ³×Æ®¿öÅ©·Î ÀÌ·ç¾îÁ®ÀÖ´Ù. LED ¿¡ÀÌÀüÆ®´Â 5°³ÀÇ ¼·Î ´Ù¸¥ »ó´ë¿Í Atari PongÀ» ¼öÇàÇßÀ» ¶§, »ó´ë Àü·«¿¡ ÀÇÇÑ È¯°æ »óÅ º¯È¸¦ ¿¹ÃøÇÒ ¼ö ÀÖµµ·Ï ¼º°øÀûÀ¸·Î ÇнÀµÇ¾úÀ¸¸ç, À̸¦ ÅëÇØ »ó´ë¹æÀÇ Àü·«ÀÌ º¯°æµÇ¾úÀ» ¶§¿¡µµ º¯È¿¡ ´ëÀÀÇÏ´Â À¯¿¬ÇÑ Àü·«À» ¼ö¸³, ºñ±³ ¸ðµ¨¿¡ ºñÇØ ³ôÀº ´©Àû º¸»ó ¼öÄ¡¸¦ º¸¿´´Ù.
|
¿µ¹®³»¿ë (English Abstract) |
|
Å°¿öµå(Keyword) |
|
ÆÄÀÏ÷ºÎ |
PDF ´Ù¿î·Îµå
|