人工智能系统近年来取得了长足的进步,尤其在自然语言处理(NLP)领域的成长更为惊人。不过现有 NLP AI 主要依赖于文本输入输出,忽略了人类在自然交流中的语调,面部表情,手势和肢体语言等线索,从而在理解方面会存在偏差。
在 AI 专业术语中,这些线索统称为副语言(paralinguistics/ paralanguage)。
微软研究院为了解决这个问题,开发了 Project Rumi,这是一个新颖的框架,旨在通过多模态副语言提示来增强人工智能的理解。该项目包括两个主要部分:多模式副语言编码器和多模式副语言解码器。
相关:
(成都大运纪事)《舞彩家园》主题晚会在大运村上演 中新网成都8月5日电 (高嘉琪)“Be Together”系列主题晚会之《舞彩家园》4日晚在成都大运村艺术中心大剧场精彩上演。 8月4日晚,开场舞《柔情似水》氛围感十足。高嘉琪 摄 当晚的演出团队都来自四..
多民族合唱音乐会上演 国家大剧院2023八月合唱节启幕 中新网北京8月5日电 (记者 高凯)多民族合唱音乐会日前在国家大剧院音乐厅上演,正式拉开了国家大剧院2023八月合唱节的序幕。 本场音乐会集合了来自壮族的坡芽歌书合唱团、侗族的黎平黄岗侗族大歌队、怒..