ÇѱÛÁ¦¸ñ(Korean Title) |
½ÉÃþ °ÈÇнÀÀÇ ÀϹÝȸ¦ À§ÇÑ º¸»ó ±â¹Ý ´ëÁ¶ÇнÀ |
¿µ¹®Á¦¸ñ(English Title) |
Reward-based Contrastive Learning for Generalization in Deep Reinforcement Learning |
ÀúÀÚ(Author) |
ȲÀοì
¼ÛÈ£ÁØ
Çѵ¿½Ä
ÀÌ°ÈÆ
À庴Ź
Inwoo Hwang
Byoung-Tak Zhan
|
¿ø¹®¼ö·Ïó(Citation) |
VOL 48 NO. 01 PP. 1086 ~ 1088 (2021. 06) |
Çѱ۳»¿ë (Korean Abstract) |
»õ·Î¿î ȯ°æ¿¡ ´ëÇÑ ÀϹÝÈ´Â Çȼ¿ ±â¹Ý °È ÇнÀ(RL)¿¡¼ °¡Àå ¾î·Á¿î ÀÛ¾÷ Áß ÇϳªÀÌ´Ù. º» ¿¬±¸¿¡¼´Â µ¿ÀÏÇÑ µµ¸ÞÀÎ ³»¿¡¼ ¼·Î ´Ù¸¥ µµ¸ÞÀÎÀÇ »ùÇõéÀ» È°¿ëÇÏ´Â ±Û·Î¹ú ¹× ·ÎÄà ´ëÁ¶ ¸ðµâÀ» °¡Áø »õ·Î¿î º¸»ó ±â¹Ý ´ëºñÇнÀ ÇÁ·¹ÀÓ¿öÅ©¸¦ Á¦¾ÈÇÏ¿© ÀÌ ¹®Á¦¸¦ ÇØ°áÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÑ´Ù. ÇÙ½É Á÷°üÀº À¯»çÇÑ È¯°æÀÇ À̹ÌÁö°¡ ¼·Î ´Ù¸¥ µµ¸ÞÀο¡¼ ¿Â À̹ÌÁöÀÏÁö¶óµµ °øÅëÀûÀΠƯ¡À» °øÀ¯ÇÑ´Ù´Â °ÍÀÌ´Ù. ±Û·Î¹ú ´ëÁ¶ ¸ðµâÀÇ °æ¿ì, ¿ì¸®´Â ȯ°æÀÇ °¨µ¶ ½ÅÈ£(¿¹: º¸»ó ¶Ç´Â ¿¡ÇǼҵå Á¾·á ½ÅÈ£)¸¦ È°¿ëÇÏ°í À̸¦ ·¹À̺í·Î »ç¿ëÇÏ¿© ¼·Î ´Ù¸¥ µµ¸ÞÀο¡ ÀÖ´Â ¾ç¼º ½ÖÀ» »ùÇøµÇÑ´Ù. Çϵå Æ÷ÁöƼºê¸¦ »ç¿ëÇÏ¿©, ¿ì¸®ÀÇ ¸ðµ¨Àº µµ¸ÞÀο¡ ºÒº¯ÇÏ´Â °°ÇÇÑ Ç¥»óÀ» ÇнÀÇÑ´Ù. ¶ÇÇÑ, ¿ì¸®´Â µ¿ÀÏÇÑ µµ¸ÞÀÎ ¾È¿¡ ÀÖ´Â À̹ÌÁöµéÀ» ±¸º°ÇÏ´Â ·ÎÄà ´ëºñ ÇнÀ ü°è¸¦ Á¦¾ÈÇÑ´Ù. ¿ì¸®´Â ÇÁ·ÏÁ¨ º¥Ä¡¸¶Å©¿¡¼ ¿ì¸®ÀÇ ¹æ¹ýÀ» ½Ã¿¬ÇÏ°í Á¦¾ÈµÈ ¹æ¹ýÀÌ ÀϹÝȸ¦ Å©°Ô °³¼±ÇÏ°í ÀÌÀü ¹æ¹ý·Ðµé¿¡ ºñÇØ ÃÖ÷´Ü ¼º´ÉÀ» ´Þ¼ºÇÑ´Ù´Â °ÍÀ» º¸¿©ÁØ´Ù. Á¦¾ÈµÈ ÇÁ·¹ÀÓ¿öÅ©´Â °£´ÜÇÏÁö¸¸ È¿°úÀûÀÌ¸ç ¸ðµç RL ¾Ë°í¸®Áò°ú °áÇÕµÉ ¼ö ÀÖ´Ù. |
¿µ¹®³»¿ë (English Abstract) |
|
Å°¿öµå(Keyword) |
|
ÆÄÀÏ÷ºÎ |
PDF ´Ù¿î·Îµå
|