首页 > 科技 > 正文

科学家开发DIR矢量图标 FA:输入图片和音频,可生成说话视频


更新日期:2023-11-17 20:26:39来源:网络点击:2000720
IT之家 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。

DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。

研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。

DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。


相关:

《千里送鹤》北京首映 陈国星金巴等影人现身支持 11月16日下午,电影《千里送鹤》首映礼在北京举行,影片导演拉华加,制片人、编剧马海泉,主演周拉多杰,演员更旦等主创悉数亮相。影片由万玛才旦监制,王钊、马海泉、拉华加担任编剧,拉华加导演,周拉多杰、朋..

谢晋百年诞辰纪念展11.21开启 将展映17部佳作 2023年11月21日,是著名电影导演谢晋的百年诞辰。据悉,在11月21日晚,中国电影资料馆携手上影集团打造的“谢晋导演诞辰百年回顾展”将在北京重磅开幕。11月21日至12月29日间,于艺术影院展映17部谢晋创作的电影..

上一篇: AI重塑媒体行业,凤凰卫视重磅入场AI数据赛道
下一篇: 拜登说好看的车找到了!原来是红旗N701,年产仅5辆