강화학습을 통한 죄수의 딜레마 게임 대응전략 연구

주정호; 이석원; Jeong-Ho Ju; Seok-Won Lee

연구문헌

홈 > 연구문헌 >

Current Result Document :

한글제목(Korean Title)	강화학습을 통한 죄수의 딜레마 게임 대응전략 연구
영문제목(English Title)	A Study on the Performance of the Strategies for the Prisoner’s Dilemma Game using Reinforcement Learning
저자(Author)	주정호 이석원 Jeong-Ho Ju Seok-Won Lee
원문수록처(Citation)	VOL 49 NO. 02 PP. 1567 ~ 1569 (2022. 12)
한글내용 (Korean Abstract)	게임 이론의 대표적인 예시인 죄수의 딜레마는 2명이 참가하는 비제로섬 게임의 일종으로, 정치학자 로버트 액설로드는 연속된 죄수의 딜레마 게임에서 최선의 전략을 확인하기 위해 이를 게임의 형태로 만들었다. 이때, 자주 활용되는 7가지 전략이 있는데, 그 중 현존하는 최강의 전략이라고 평가받는 것은 Copycat이다. 처음에는 협력으로 시작하지만, 그 다음부터 상대의 이전 선택을 그대로 따라하는 것이다. 본 논문에서는 현재 게임 상태, 협력 및 배신, 획득 점수를 강화학습의 State, Action, Reward로 활용하여 모델이 Copycat을 뛰어넘는 전략을 펼칠 수 있는지 연구한다. 이를 위해 간단한 Fully Connected Layer 구조와 REINFORCE 알고리즘을 이용하는 방법을 제안한다. 또한, 강화학습을 게임 이론에 적용하여 사회 과학, 경제학, 정치학 등의 문제 해결로 나아갈 수 있는 발전 가능성을 확인하고자 한다.
영문내용 (English Abstract)
키워드(Keyword)
파일첨부	PDF 다운로드

사이트맵

연구문헌

교육정보

심화정보

컴퓨터iN

연구자료

알림마당

CSERIC 광장

서비스 바로가기

Please wait....

연구문헌

Current Result Document :