Çѱ۳»¿ë (Korean Abstract) |
À½¼º °¨Á¤ ÀνÄ(Speech Emotion Recognition, SER)ºÐ¾ß´Â À½¼º Ư¡°ú ¸ðµ¨¸µÀ» È°¿ëÇÏ¿© ÀνķüÀ» °³¼±Çϱâ À§ÇÑ ¸¹Àº ¿¬±¸µéÀÌ ÁøÇàµÇ°í ÀÖ´Ù. ÃÖ±Ù¿¡´Â À½¼º °¨Á¤ ÀνÄÀ» ³ôÀ̱â À§ÇÑ ¸ðµ¨¸µ ¿¬±¸ ÀÌ¿Ü¿¡µµ À½¼º Ư¡À» ´Ù¾çÇÑ ¹æ¹ýÀ¸·Î È°¿ëÇÏ´Â ¿¬±¸µéÀÌ ÁøÇàµÇ°í ÀÖ´Ù. º» ³í¹®¿¡¼´Â À½¼º °¨Á¤ÀÌ ½Ã°£ È帧°ú ¿¬°üÀÌ ÀÖÀ½À» Âø¾ÈÇÏ¿© ½Ã°è¿ ¹æ½ÄÀ¸·Î À½¼ºÆÄÀÏÀ» ½Ã°£ ±¸°£º°·Î ºÐ¸®ÇÑ ´ÙÀ½ À½¼º Ư¡ÀÎ Mel, Chroma, ZCR, RMS, MFCC¸¦ ÃßÃâÇÏ¿©¼ ¼øȯÇü ½Å°æ¸Á ¸ðµ¨¿¡ Àû¿ëÇÏ¿© ÈÀåÀÇ À½¼º µ¥ÀÌÅÍ¿¡¼ °¨Á¤À» ºÐ·ùÇÏ´Â ¸ðµ¨À» Á¦¾ÈÇÑ´Ù. Á¦¾ÈµÈ ¹æ¹ýÀ¸·Î RNN, GRU, LSTMÀÇ ¸ðµ¨À» °ø´ë ¿µ¾î µ¥ÀÌÅÍ ¼ÂÀÎ IEMOCAP µ¥ÀÌÅÍ ¼ÂÀÇ ¼º´ÉÀ» ºñ±³ ¹× ºÐ¼®ÇÏ¿´´Ù. |