• 전체
  • 전자/전기
  • 통신
  • 컴퓨터
닫기

사이트맵

Loading..

Please wait....

홈 홈 > 연구문헌 >

Current Result Document : 646 / 646

한글제목(Korean Title) K-평균 클러스터링을 이용한 국민청원 내용과 동의 수 분석
영문제목(English Title) Analysis of National petition contents and number of consent using K-Means Clustering
저자(Author) 이다인   김유섭   Da-In Lee   Yu-Seop Kim  
원문수록처(Citation) VOL 47 NO. 01 PP. 1429 ~ 1431 (2020. 07)
한글내용
(Korean Abstract)
본 논문에서는 K-평균 클러스터링을 활용하여 청원내용과 동의 수의 분포를 분석한다. 청원을 crawling한 후, 각 청원을 twitter 형태소 분석기 (okt)로 토큰화 (tokenize) 한다. 그리고 scikit-learn의 TF-IDF를 활용하여 특성 단어의 빈도수에 따라 벡터화하고 문서에 대한 중요도를 수치화한다. 또한, 가중치에 따라 정렬된 내용의 특징 벡터를 PCA, T-SNE 알고리즘을 이용해 차원 축소하여 시각화하고 K-평균 연산으로 나눠진 cluster 별 데이터들의 키워드를 추출한다. 마지막으로 K-평균 클러스터링 그래프를 통해 cluster 별 동의 수의 평균, 표준편차, 최댓값, 최솟값을 구했으며, 이를 통해 청원내용과 동의 수 분포를 시각적으로 표현함으로써 국민청원의 실태를 살펴본다.
영문내용
(English Abstract)
키워드(Keyword)
파일첨부 PDF 다운로드