• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

Ȩ Ȩ > ¿¬±¸¹®Çå >

Current Result Document :

ÇѱÛÁ¦¸ñ(Korean Title) °­È­ÇнÀÀ» ÅëÇÑ Á˼öÀÇ µô·¹¸¶ °ÔÀÓ ´ëÀÀÀü·« ¿¬±¸
¿µ¹®Á¦¸ñ(English Title) A Study on the Performance of the Strategies for the Prisoner¡¯s Dilemma Game using Reinforcement Learning
ÀúÀÚ(Author) ÁÖÁ¤È£   À̼®¿ø   Jeong-Ho Ju   Seok-Won Lee  
¿ø¹®¼ö·Ïó(Citation) VOL 49 NO. 02 PP. 1567 ~ 1569 (2022. 12)
Çѱ۳»¿ë
(Korean Abstract)
°ÔÀÓ ÀÌ·ÐÀÇ ´ëÇ¥ÀûÀÎ ¿¹½ÃÀÎ Á˼öÀÇ µô·¹¸¶´Â 2¸íÀÌ Âü°¡ÇÏ´Â ºñÁ¦·Î¼¶ °ÔÀÓÀÇ ÀÏÁ¾À¸·Î, Á¤Ä¡ÇÐÀÚ ·Î¹öÆ® ¾×¼³·Îµå´Â ¿¬¼ÓµÈ Á˼öÀÇ µô·¹¸¶ °ÔÀÓ¿¡¼­ ÃÖ¼±ÀÇ Àü·«À» È®ÀÎÇϱâ À§ÇØ À̸¦ °ÔÀÓÀÇ ÇüÅ·Π¸¸µé¾ú´Ù. À̶§, ÀÚÁÖ È°¿ëµÇ´Â 7°¡Áö Àü·«ÀÌ Àִµ¥, ±× Áß ÇöÁ¸ÇÏ´Â ÃÖ°­ÀÇ Àü·«À̶ó°í Æò°¡¹Þ´Â °ÍÀº CopycatÀÌ´Ù. óÀ½¿¡´Â Çù·ÂÀ¸·Î ½ÃÀÛÇÏÁö¸¸, ±× ´ÙÀ½ºÎÅÍ »ó´ëÀÇ ÀÌÀü ¼±ÅÃÀ» ±×´ë·Î µû¶óÇÏ´Â °ÍÀÌ´Ù. º» ³í¹®¿¡¼­´Â ÇöÀç °ÔÀÓ »óÅÂ, Çù·Â ¹× ¹è½Å, ȹµæ Á¡¼ö¸¦ °­È­ÇнÀÀÇ State, Action, Reward·Î È°¿ëÇÏ¿© ¸ðµ¨ÀÌ CopycatÀ» ¶Ù¾î³Ñ´Â Àü·«À» ÆîÄ¥ ¼ö ÀÖ´ÂÁö ¿¬±¸ÇÑ´Ù. À̸¦ À§ÇØ °£´ÜÇÑ Fully Connected Layer ±¸Á¶¿Í REINFORCE ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÏ´Â ¹æ¹ýÀ» Á¦¾ÈÇÑ´Ù. ¶ÇÇÑ, °­È­ÇнÀÀ» °ÔÀÓ À̷п¡ Àû¿ëÇÏ¿© »çȸ °úÇÐ, °æÁ¦ÇÐ, Á¤Ä¡ÇÐ µîÀÇ ¹®Á¦ ÇØ°á·Î ³ª¾Æ°¥ ¼ö ÀÖ´Â ¹ßÀü °¡´É¼ºÀ» È®ÀÎÇÏ°íÀÚ ÇÑ´Ù.
¿µ¹®³»¿ë
(English Abstract)
Å°¿öµå(Keyword)
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå