中国首个Sora级视频大模型发布 性能全面对标国际顶尖水平

2024-04-27 20:00:57 来源:网络

凤凰网科技讯(作者/于雷) 4月27日,在今日举行中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。

","type":"text"},{"data":{"duration":91,"bigPosterUrl":"https://x0.ifengimg.com/ucms/2024_17/911A4667C3FC1A1189305196F8012F99585AA89E_size35_w1920_h1080.jpg","attachmentType":"video","fileSize":"13456","guid":"ae499454-8cc0-4bf6-a655-089194f49b58","audioFileSize":"1426","attachmentId":"ae499454-8cc0-4bf6-a655-089194f49b58","mobileUrl":"https://video19.ifeng.com/video09/2024/04/27/p7189824509258502844-102-113404.mp4","title":"中国首个长时长、高一致性、高动态性视频大模型,「Vidu」登场!","base62Id":"8Z64L4dK7y8","playUrl":"https://video19.ifeng.com/video09/2024/04/27/p7189824509258502844-102-113404.mp4","keywords":"模型 架构 模态 vit sora vidu 一致性 视频 动态性 团队"},"type":"video"},{"data":"

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。

Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。

基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,团队在短短两个月里进一步突破了长视频表示与处理的多项关键技术,研发了Vidu视频大模型,显著提升视频的连贯性和动态性。

Vidu的问世,不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证,也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。作为通用视觉模型,Vidu能够支持生成更加多样化、更长时长的视频内容,同时面向未来,灵活架构将能够兼容更广泛的模态,进一步拓展多模态通用能力的边界。

,中国首个Sora级视频少年壮志不言愁简谱 大模型发布 性能全面对标国际顶尖水平

相关:

回应美年度人权报告,墨总统批评美国“傲慢”参考消息网4月27日报道 据埃菲社4月26日报道,墨西哥总统洛佩斯26日指责美国官员对国际关系抱有“非常傲慢”和“干涉主义”的观念。报道称,洛佩斯在例行记者会上谴责说:“美国政府的一些官员有不同的观念,非常傲慢,执着于旧的干预主义和干涉主义政策。”他这番话是对美国国务院年度人权报告作出的回应,该报告指出了墨西哥的暴力和有罪不罚现象。不过,他也强调与美国总统拜登和副总统卡玛拉·哈里斯有着“非常良好的关系”..

朝方谴责美国对朝鲜发射卫星说三道四据朝中社4月27日报道,朝鲜国家航空航天技术总局发言人当天发表谈话。谈话称,美国太空司令部司令日前访问韩日时称,朝鲜发射的航天发射体或导弹违反“联合国决议”,要求停止此类行为。目前,美国全面否定朝鲜正当合法的宇宙开发权利和自卫权,把太空当做压制别国的军事手段。朝方对这种霸权图谋表示严重关切,并坚决反对。(总台记者 董海涛)

有风来丨“文化中国行”遇见的三张文化面孔  4月23日至26日,“文化中国行”主题采访活动走进浙江。来自20余家中央、行业类及浙江省级媒体,共90余名记者编辑,分两路走访了杭州、湖州、绍兴、嘉兴、衢州、丽水等地,探访古建筑、老街区。有风君随采访团先后来到清河坊历史街区、崇仁古镇等处调研采访。   漫步古镇老街,看见的是古韵绵长、老街新事、悠悠乡愁,也遇见了生于兹长于兹的不同面孔,他们有文化单位主理人、非遗传承人、故事讲述人。职业不同,身份不一..

SING女团新歌几阙清歌伞舞火出圈,B站热搜TOP92024年超人气国风女子组合SING女团持续深耕电子国风领域,作品不断,有全新演绎央视春晚热歌《上春山》,也有上新原唱作品《几阙清歌》《可叹》,其中《几阙清歌》伞舞更是一跳出圈。除了歌曲外,SING女团惊喜亮相由共青团中央举办的“中国华服周·沪上繁花”系列活动,为华服韵典舞台献上马面裙版《不问别离》表演,与中华传统文化跨时空对话。作为亚洲首个电子国风女团,SING女团通过音乐作品和舞台表演,不断探索国风音乐的无..

外媒:英特尔面临多种挑战,正努力重振昔日辉煌【环球网科技综合报道】曾在美国芯片行业中占据主导地位的英特尔,近日公布了其第一季度财报,结果显示表现不佳,期待已久的业绩反弹似乎仍然遥不可及。投资者对此反应强烈,周五该股股价下跌9%,触及今年最低点。尽管英特尔的收入已停止下滑,且依然保持着个人电脑和笔记本电脑处理器最大制造商的地位,但其第一季度的销售额并未达到预期。同时,英特尔对第二季度的预测也显得较为疲软,暗示市场需求并不旺盛。图片来源:英特尔..

英特尔晶圆厂,将拿到新的投资?据知情人士透露,Apollo Global Management Inc.、KKR & Co. 和 Stonepeak 可能会向一家合资企业注资数十亿美元,为英特尔公司在爱尔兰的半导体制造工厂提供资金。知情人士称,另类资产管理公司正在考虑投资一家合资企业,该合资企业可能筹集数十亿美元,包括债务。据彭博社二月份报道,这家芯片制造巨头正在与顾问合作,已开始征求潜在投资者的兴趣。知情人士称,包括潜在合资企业的规模和结构在内的条款尚未最终确定,..

日本扩大半导体出口控制日本表示,计划扩大对与半导体或量子计算相关的四项技术的出口限制,这是全球控制战略技术流动的最新举措。东京的新措施将影响用于分析纳米粒子图像的扫描电子显微镜,以及三星电子公司采用的用于改进半导体设计的全栅晶体管技术。日本还将要求量子计算机中使用的低温 CMOS 电路以及量子计算机本身的运输获得许可证。向所有国家(包括最受惠的贸易伙伴韩国、新加坡和台湾)的此类货物将需要出口管制官员的批准。日本经济产业省..

HBM4,大战打响!AI的火热,除了带动GPU的大红大紫以外,背后的重要存储技术HBM也在过去几年冲上了风口浪尖。最近,SK hynix和三星的业绩和动作标明,HBM在未来大有可为。据路透社报道,HBM 芯片目前占通用内存市场的 15%,而去年这一比例为 8%。SK 海力士在 HBM 市场拥有最大的市场份额,由于生成式 AI 热潮刺激了对 Nvidia GPU 的需求,该市场的需求猛增。它是占据 AI GPU 市场 80% 份额的 Nvidia 的 HBM3 内存唯一供应商..

消息称索尼5月17日推出Xperia 1 VI手机,起售价8858元原标题:消息称索尼5月17日推出Xperia 1 VI手机,起售价39900新台币IT之家 4 月 18 日消息,索尼去年 5 月 11 日发布了 Xperia 1 V,此前有消息称索尼将于 5 月 17 日举办 Xperia 新品发布会推出 Xperia 1 VI 手机。目前这款手机的价格信息已经被日媒 sumahodigest 曝光,其中显示这款手机在台湾地区起售价为 39900 新台币(IT之家备注:当前约 8858 元人民币),作为比较,索尼 Xperia 1 V 在..

关于哥大抗议,国内传播最广的,其实是一条假新闻很多读者都发私信谈到“哥大犹太教授禁止入校,因为担心安全”。这是一条假新闻。视频是商学院的一位犹太教授刷卡进教学楼,发现卡失灵了。我去东亚系看Andrew Nathan教授,他是中国问题专家,也是一位犹太人。我能见到他,就说明犹太教授可以进校园。我问他怎么看待这位教授进学校遇阻,他笑了:他是一位极端主义者。这不是说极端主义者就会卡失灵,而是说这是故意“制造”的一个热点。当然,我不用向Andrew教授核实,就知道“..