Current Result Document :
ÇѱÛÁ¦¸ñ(Korean Title) |
ºñµð¿À ÁúÀÇÀÀ´äÀ» À§ÇÑ ¸ÖƼ¸ð´Þ ¹®¸Æ Æ®·£½ºÆ÷¸Ó |
¿µ¹®Á¦¸ñ(English Title) |
Multi-modal Contextual Transformer for Video Question Answering |
ÀúÀÚ(Author) |
ÃÖ¼ºÈ£
À庴Ź
Seongho Choi
Byoung-Tak Zhang
|
¿ø¹®¼ö·Ïó(Citation) |
VOL 48 NO. 02 PP. 0801 ~ 0803 (2021. 12) |
Çѱ۳»¿ë (Korean Abstract) |
ºñµð¿À ÁúÀÇÀÀ´ä(Video Question Answering)Àº ºñµð¿À ÀÌÇØ ´É·ÂÀ» ÀÚ¿¬¾î ÇüÅ·ΠµÈ ¿ÀÁö¼±´ÙÀÇ °´°ü½Ä ¹®Á¦ÀÇ Á¤È®µµ·Î ÃøÁ¤ÇÑ´Ù. ±âÁ¸¿¡ Æ®·£½ºÆ÷¸Ó¸¦ È°¿ëÇÏ¿© ºñµð¿À ÁúÀÇÀÀ´äÀ» ÇØ°áÇϱâ À§ÇÑ ±â¹ýÀº Æ®·£½ºÆ÷¸Ó °è»ê ºñ¿ëÀÌ ºñµð¿ÀÀÇ ±æÀÌ°¡ ´Ã¾î³²¿¡ µû¶ó ±âÇϱ޼öÀûÀ¸·Î Áõ°¡ÇÏ¿© »çÀüÇнÀ ´Ü°è¿¡¼ ¹®¸ÆÀ» °í·ÁÇÏÁö ¸øÇߴٴ Ư¡ÀÌ ÀÖ´Ù. ÇÏÁö¸¸ ºñµð¿ÀÀÇ ¹®¸ÆÀº ºñµð¿ÀÀÇ ³»¿ëÀ» ÀÚ¿¬½º·´°Ô ÀÌÇØÇϱâ À§ÇØ ÇʼöÀûÀ¸·Î °í·ÁµÇ¾î¾ß ÇÑ´Ù. º» ³í¹®¿¡¼´Â ºñµð¿ÀÀÇ ¹®¸ÆÀ» °í·ÁÇÏ¿© Æ®·£½ºÆ÷¸Ó¸¦ ÇнÀ½ÃÅ°´Â ¹æ¹ýÀ» Á¦¾ÈÇϸç, À̸¦ ÀÌ¿ëÇÏ¿© ºñµð¿À ÁúÀÇÀÀ´äÀ» ÇØ°áÇÏ°íÀÚ ÇÑ´Ù. Á¦¾ÈÇÏ´Â Æ®·£½ºÆ÷¸Ó ÇнÀ ±â¹ýÀº ºñµð¿À ÁúÀÇÀÀ´ä ¿Ü¿¡µµ ºñµð¿À ÀÌÇظ¦ À§ÇÑ ´Ù¾çÇÑ ÇüÅÂÀÇ Å½ºÅ©¿¡µµ È°¿ëµÉ ¼ö ÀÖ´Ù.
|
¿µ¹®³»¿ë (English Abstract) |
|
Å°¿öµå(Keyword) |
|
ÆÄÀÏ÷ºÎ |
PDF ´Ù¿î·Îµå
|