Current Result Document :
ÇѱÛÁ¦¸ñ(Korean Title) |
°ÈÇнÀÀ» ÅëÇÑ Á˼öÀÇ µô·¹¸¶ °ÔÀÓ ´ëÀÀÀü·« ¿¬±¸ |
¿µ¹®Á¦¸ñ(English Title) |
A Study on the Performance of the Strategies for the Prisoner¡¯s Dilemma Game using Reinforcement Learning |
ÀúÀÚ(Author) |
ÁÖÁ¤È£
À̼®¿ø
Jeong-Ho Ju
Seok-Won Lee
|
¿ø¹®¼ö·Ïó(Citation) |
VOL 49 NO. 02 PP. 1567 ~ 1569 (2022. 12) |
Çѱ۳»¿ë (Korean Abstract) |
°ÔÀÓ ÀÌ·ÐÀÇ ´ëÇ¥ÀûÀÎ ¿¹½ÃÀÎ Á˼öÀÇ µô·¹¸¶´Â 2¸íÀÌ Âü°¡ÇÏ´Â ºñÁ¦·Î¼¶ °ÔÀÓÀÇ ÀÏÁ¾À¸·Î, Á¤Ä¡ÇÐÀÚ ·Î¹öÆ® ¾×¼³·Îµå´Â ¿¬¼ÓµÈ Á˼öÀÇ µô·¹¸¶ °ÔÀÓ¿¡¼ ÃÖ¼±ÀÇ Àü·«À» È®ÀÎÇϱâ À§ÇØ À̸¦ °ÔÀÓÀÇ ÇüÅ·Π¸¸µé¾ú´Ù. À̶§, ÀÚÁÖ È°¿ëµÇ´Â 7°¡Áö Àü·«ÀÌ Àִµ¥, ±× Áß ÇöÁ¸ÇÏ´Â ÃÖ°ÀÇ Àü·«À̶ó°í Æò°¡¹Þ´Â °ÍÀº CopycatÀÌ´Ù. óÀ½¿¡´Â Çù·ÂÀ¸·Î ½ÃÀÛÇÏÁö¸¸, ±× ´ÙÀ½ºÎÅÍ »ó´ëÀÇ ÀÌÀü ¼±ÅÃÀ» ±×´ë·Î µû¶óÇÏ´Â °ÍÀÌ´Ù. º» ³í¹®¿¡¼´Â ÇöÀç °ÔÀÓ »óÅÂ, Çù·Â ¹× ¹è½Å, ȹµæ Á¡¼ö¸¦ °ÈÇнÀÀÇ State, Action, Reward·Î È°¿ëÇÏ¿© ¸ðµ¨ÀÌ CopycatÀ» ¶Ù¾î³Ñ´Â Àü·«À» ÆîÄ¥ ¼ö ÀÖ´ÂÁö ¿¬±¸ÇÑ´Ù. À̸¦ À§ÇØ °£´ÜÇÑ Fully Connected Layer ±¸Á¶¿Í REINFORCE ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÏ´Â ¹æ¹ýÀ» Á¦¾ÈÇÑ´Ù. ¶ÇÇÑ, °ÈÇнÀÀ» °ÔÀÓ À̷п¡ Àû¿ëÇÏ¿© »çȸ °úÇÐ, °æÁ¦ÇÐ, Á¤Ä¡ÇÐ µîÀÇ ¹®Á¦ ÇØ°á·Î ³ª¾Æ°¥ ¼ö ÀÖ´Â ¹ßÀü °¡´É¼ºÀ» È®ÀÎÇÏ°íÀÚ ÇÑ´Ù. |
¿µ¹®³»¿ë (English Abstract) |
|
Å°¿öµå(Keyword) |
|
ÆÄÀÏ÷ºÎ |
PDF ´Ù¿î·Îµå
|