中国首个Sora级视频大模型发布 自称性能国际顶尖水平

2024-04-27 21:38:38 来源:网络

凤凰网科技讯(作者/于雷) 4月27日,在今日举行中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。

","type":"text"},{"data":{"duration":91,"bigPosterUrl":"https://x0.ifengimg.com/ucms/2024_17/911A4667C3FC1A1189305196F8012F99585AA89E_size35_w1920_h1080.jpg","attachmentType":"video","fileSize":"13456","guid":"ae499454-8cc0-4bf6-a655-089194f49b58","audioFileSize":"1426","attachmentId":"ae499454-8cc0-4bf6-a655-089194f49b58","mobileUrl":"https://video19.ifeng.com/video09/2024/04/27/p7189824509258502844-102-113404.mp4","title":"中国首个长时长、高一致性、高动态性视频大模型,「Vidu」登场!","base62Id":"8Z64L4dK7y8","playUrl":"https://video19.ifeng.com/video09/2024/04/27/p7189824509258502844-102-113404.mp4","keywords":"模型 架构 模态 vit sora vidu 一致性 视频 动态性 团队"},"type":"video"},{"data":"

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。

Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。

基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,团队在短短两个月里进一步突破了长视频表示与处理的多项关键技术,研发了Vidu视频大模型,显著提升视频的连贯性和动态性。

Vidu的问世,不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证,也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。作为通用视觉模型,Vidu能够支持生成更加多样化、更长时长的视频内容,同时面向未来,灵活架构将能够兼容更广泛的模态,进一步拓展多模态通用能力的边界。

,中国首个Sora级少年阿bin 视频大模型发布 自称性能国际顶尖水平

相关:

全美高校反战抗议持续,美媒揭秘:这把火怎么点起来的?(观察者网讯)自上周美国警方在哥伦比亚大学进行大规模逮捕行动后,美国高校支持巴勒斯坦的抗议活动愈演愈烈。当地时间4月26日,美媒《华盛顿邮报》采访了多名抗议行动的组织者和参与者,揭开了这把从哥伦比亚大学烧起来的火,究竟是如何被“点燃”,并进而发展成全美顶尖高校一片燎原的。报道称,尽管从表面上看,这场全美高校抗议活动最近几天才登上了全球的头条新闻,但它们其实是已经持续了数月的校园活动和早先校园紧张局..

广州青年夜校助大湾区青年触及更多领域知识  中新网广州4月27日电 (记者 王坚)由共青团广州市委员会(下称“团市委”)主办的“Young城Yeah校 激发新质‘青’动能”2024年广州青年夜校启动仪式26日晚在广州举行。 广州青年夜校(文化学堂)技能提升课《尤克里里》。团市委 供图   团市委介绍,该委聚焦粤港澳大湾区青年对理论提升、文化生活、素质教育、技能学习、身心健康等方面的现实需要,今年对青年夜校课程体系进行了全面升级,设置了“红棉学堂”“文化学堂..

河南多地纪念古圣先贤催生文旅新风尚  中新网郑州4月27日电 (王宇)“天降诗圣,千秋仰慕。毓秀嵩阴,钟灵洛土……”4月27日上午,第十届杜甫国际诗歌周暨“天下诗人拜诗圣”活动在河南巩义开幕,吸引了来自海内外的众多诗人词家暨文化爱好者参与。   巩义作为杜甫故里,位于河洛文化核心区,一千多年前,伟大的现实主义诗人杜甫就诞生于此。杜甫对中国古典诗歌的影响深远,被誉为“诗圣”,其诗歌更被尊称为“诗史”。   开幕式上,一篇甲辰版《拜诗圣文》..

关掉“滤镜” 音综何去何从  近日,Live挑战类节目《百分百歌手》推出幕后纪录片,真实再现团队从零打造音综的艰难过程。作为一档“不假唱、不修音、不重来”的小体量综艺,节目在制作之初便引起网友广泛关注,收获免费“云监工”。然而,该综艺播出至今,市场反馈平平。爆款难产的当下,不修音的音乐综艺节目是否还有生存空间?没有后期加工效果,歌手们不加粉饰的真实现场还能否打动人心?   记 者 张向阳   实习生 陈佳佳 济南报道   ..

五一档电影谁是黑马  据灯塔专业版显示,今年电影五一档已有9部影片定档。截至4月26日,五一档预售总票房已超7000万元,《九龙城寨之围城》《维和防暴队》《间谍过家家 代号:白》预售票房位居前列。总体来看,今年五一档影片供给数量充足,题材涵盖喜剧、爱情、悬疑、动画等多种类型,但缺乏头部热门影片。在文旅消费火热的“五一”假期,差异化的电影内容能否满足观众多样化的观影需求?以量取胜能否接续春节档、清明档的观影热潮?   刘..

五月初择机发射!它这次“出差”要去月球背面→  今天(4月27日),在中国文昌航天发射场,嫦娥六号探测器和长征五号遥八运载火箭器箭组合体垂直转运至发射区,计划于5月初择机发射。   总台央视记者 李宁:在经过了三公里,近两个小时的时间之后,长征五号遥八运载火箭以及嫦娥六号器箭组合体正在缓缓地靠近塔架,这也意味着嫦娥六号发射任务进入发射的最后倒计时。三年多以前,就是从这个发射场,这个发射塔架见证了嫦娥五号一路的精彩。我们也相信嫦娥六号接下来也必将..

2024年水资源领域“澜湄周”活动举办  人民网北京4月27日电 (欧阳易佳)4月26日,2024年水资源领域“澜湄周”活动在京举办。与会代表就深化澜湄水资源合作等话题深入交流。   水利部国科司司长金海表示,澜湄六国“同饮一江水,命运紧相连”,有着先天的合作优势、牢固的合作基础、强烈的合作愿望、巨大的合作潜力。中方愿同流域各国一道,加强治水理念和经验分享,深化技术交流、项目合作、人才培养,积极探索全流域治理管理合作,持之以恒推进澜湄水资源合作..

被围剿的周迅:一个影后的倒“第一个吐槽《如懿传》的人简直是个天才。”最早吐槽《如懿传》的B站Up主,就是《皇帝的新衣》里面那个敢站出来说真话的小孩。这部电视剧花了3亿人民币,结果却拉了一坨大的。这是迟到六年的骂声。《甄嬛传》在前,细读清宫戏已经成了互联网显学。在其他清宫戏越咂摸越有味的长尾效应之中,只有《如懿传》脱颖而出:这部剧的二次翻红,是被观众的唾沫星子“骂”出来的。去年7月,B站某游戏up主@没事卡了打响了“反懿起义”第一..

3人驾车强闯进京检查站,先后被拘留通州公安分局4月27日发布消息,警方近期先后拘留3名强行驾车闯过检查站的违法人员。4月26日4时许,戴某某(男,57岁)驾驶一辆京牌厢式货车在通州区小甸屯公安检查站以逆行方式强行通过,后驶离检查站。依据《中华人民共和国治安管理处罚法》第五十条第一款第(二)项、第五十条第二款之规定,通州警方依法对戴某处以行政拘留5日的处罚。3月9日9时许,张某某(男,23岁)与白某某(男,40岁)二人驾驶一辆外埠号牌小客车在途经通..

英特尔计划明年中旬发布Intel 18A制程处理器集微网消息 在日前举行的英特尔Q1财报电话会议中,英特尔表示计划在明年中旬发布Intel 18A制程处理器产品。据介绍,Intel 18A的正式版PDK 套件将于本季度推出。基于该制程的 Clearwater Forest(至强 7 能效核)和 Panther Lake(有望成为英特尔酷睿 300 系列)处理器现已进入晶圆厂。这些产品的产能爬坡将从 2025 年上半年开始,产品发布将在明年中进行。英特尔认为 Clearwater Forest 和 Panther Lake 均..