시계열 기반의 음성 특징을 이용한 음성 감정인식에 대한 연구

홈 > 연구문헌 >

한글제목(Korean Title)	시계열 기반의 음성 특징을 이용한 음성 감정인식에 대한 연구
영문제목(English Title)	Research of Speech Emotion Recognition Using Voice Features Based on Time Series
저자(Author)	신현삼 홍준기 손승일 홍성찬 Hyun-Sam Shin Jun-Ki Hong Seung-Il Sonh Sung-Chan Hong
원문수록처(Citation)	VOL 23 NO. 02 PP. 0013 ~ 0014 (2022. 10)
한글내용 (Korean Abstract)	음성 감정 인식(Speech Emotion Recognition, SER)분야는 음성 특징과 모델링을 활용하여 인식률을 개선하기 위한 많은 연구들이 진행되고 있다. 최근에는 음성 감정 인식을 높이기 위한 모델링 연구 이외에도 음성 특징을 다양한 방법으로 활용하는 연구들이 진행되고 있다. 본 논문에서는 음성 감정이 시간 흐름과 연관이 있음을 착안하여 시계열 방식으로 음성파일을 시간 구간별로 분리한 다음 음성 특징인 Mel, Chroma, ZCR, RMS, MFCC를 추출하여서 순환형 신경망 모델에 적용하여 화장의 음성 데이터에서 감정을 분류하는 모델을 제안한다. 제안된 방법으로 RNN, GRU, LSTM의 모델을 공대 영어 데이터 셋인 IEMOCAP 데이터 셋의 성능을 비교 및 분석하였다.
영문내용 (English Abstract)
키워드(Keyword)
파일첨부	PDF 다운로드

사이트맵