他来了他来了,老黄带着「最强生成式AI处理器」和一系列重磅更新来了!
在计算机图形学顶会SIGGRAPH上,老黄宣布了英伟达最新的超级芯片NVIDIA DGX GH200 Grace Hopper。
这块芯片搭载了全球最快的内存,不仅带宽每秒5TB,内存容量更是暴增接近50%来到141GB,「任何大语言模型都能运行」。
同时,英伟达还宣布了和Hugging Face的合作——
以后在Hugging Face平台上,不需要再下载ML模型自己运行,只需要几步简单操作,就能在笔记本上运行大模型,有Colab内味了(就是不知道有没有免费版)。
至于软件更新,字里行间也全是AI。
不仅在Omniverse平台中集成了一系列时下热门的AI工具,新的软件有不少也是基于大模型打造,像ChatUSD就能帮开发者们写代码。
这也是时隔五年,老黄再次登上SIGGRAPH的舞台。在会上,他自信满满地宣布:生成式人工智能的「iPhone时刻」,已经来临。
有网友看完发布会后感慨:英伟达在AI硬件这方面,已经无人能及了。
新芯片组成的「最强超算」来袭
这场发布会中最先抛出,也是最引人瞩目的,非「最强超算」莫属。
这台超级计算机由256块DGX GH200 Grace Hopper(简称DGX GH200)连接而成。
用老黄的话,这个「庞然大物」就是为AIGC时代量身打造的。
它的算力和内存容量分别达到了1E(10^15)FLOPS和144TB。
下面这张图展示了它的真实大小(中间的黑影是老黄)。
不仅是性能优异,对比发现,性价比简直完爆CPU。
同样花1亿美元,拿来买CPU和GPU分别能得到什么?
CPU的话,可以买8800个x86架构的产品。
这近九千块CPU加起来,只能带动一个LLaMA 2、SDXL这样规模的AI程序。
功率嘛……是5兆瓦,也就是每小时5000度电。
如果换成GPU的话,则是2500块DGX GH200。
能带动的近似规模的AI程序一下增加到了12个,功率却降低到了3兆瓦。
平均到单个程序上,需要210块DGX GH200,价格是800万美元,功率则为0.26兆瓦。
而组成这个「最强超算」的DGX GH200,同样是王者级别,被称为「最强生成式AI处理器」。
DGX GH200由Grace CPU和Hopper GPU组成。
其中Grace CPU包含72核心,而后者拥有4P(10^12)FLOPS的算力和500GB的LPDDR5X。
此外,DGX GH200中还加入了海力士的「最快内存」HBM3e。
它的容量为141GB,带宽则高达每秒5TB,分别是H100的1.7倍和1.55倍。
(好家伙,H100都只配当baseline了)
在DGX GH200中,CPU和GPU之间的连接速度是第五代PCIe的7倍。
而从单块DGX GH200到整个超级计算机的过程,主打的就是一个「叠」。
这要得益于它的多GPU高速连接能力。
双联体的DGX GH200,性能几乎没有损失,直接就是单体的两倍。
将双联体的DGX GH200与BlueField-3 DPU和ConnectX-7网卡,就组成了一个「计算盒」。
通过NVLink,8个这样的「计算盒」高速连接,就得到了DGX构建块,总内存达到了4.6TB。
这样的构建块可以合二为一形成新的计算盒,并最终扩展成256 GPU的工作集群Superpod。
NVLink的高速连接能力,让这256块GPU「就像是一块一样」工作。
至此,显卡超算的规模已经达到了本节开头老黄所展示的水平。
但这还没有结束——Superpod之间还能继续连接。
在高速低延时的Quantum-2 Infiniband平台帮助下,超算的规模可以接着扩展……
讲到这里,老黄还打趣道:
如果哪天你从(某电商平台)上买显卡的时候发现了它,千万不要觉得惊讶!
总之,根据不同需要,利用DGX GH200将能构建出不同规模的、适应AIGC时代的超级计算机。
据预计,DGX GH200将于明(2024)年第二季度投产。
还发了3个RTX新专业显卡
除了「最强生成式AI处理器」以外,英伟达这次也推出了3款船新的工作站显卡:
RTX 5000、RTX 4500和RTX 4000。
这几款显卡均基于Ada Lovelace架构设计,目前参数已经同步英伟达官网:
当然,专业显卡售价也更贵。
其中RTX 5000售价达到4000美元(约合人民币2.87万元),RTX 4500售价2250美元(约1.6万元),RTX 4000售价1250美元(约8987元)。
老黄也在发布RTX显卡时,再次说出那句经典名言:
买得越多,省得越多(the more you buy, the more you save)。
至于去年9月发布的RTX 6000 Ada显卡,在这次大会上也推出了一个新的工作站设计:4块叠起来,搞个顶级「叠叠乐」。
这样设计的单个RTX工作站,单个可以提供5828 TFLOPS的AI性能,以及192GB的GPU内存。
除此之外,老黄还在这次大会上宣布了一个搭载L40S Ada GPU的新款OVX服务器,数据中心专用。
每台服务器搭载8块L40S Ada GPU,每块L40S包含高达18176个CUDA核心,可以提供提供近5倍于A100的单精度浮点(FP32)性能。
相比A100,L40S微调(fine-tune)大模型的性能提升了大约1.7倍。
(没错,A100已经被老黄用来给新硬件当对比了)
具体来说,在这个OVX服务器上微调一个860M参数的大模型,现在只需要7小时就可以完成;
400亿参数的GPT-3大模型,更是只需要15个小时就能微调完成。
在渲染上,L40S性能也不错,配备了142个第三代RT核心,可以提供212 teraflops的光线追踪性能。
预计L40S将于今年秋季上市。
AIGC版Colab来了,笔记本跑大模型
不仅是硬件上接连抛出一系列「重磅炸弹」,软件方面英伟达也发布了多款新产品。
首先是和HuggingFace合作,把NVIDIA DGX Cloud AI整合到其中。
在HF的页面中,一键就能让模型在云上调整运行。
英伟达科学家范麟熙(Jim Fan)激动地宣布了这一消息,还透露其中使用的每个节点都是8个H100或A100。
除了与HF合作,英伟达还推出了自己的Workbench平台。
通过连接云端服务,用笔记本电脑就能跑大模型。
现场还播放了通过Workbench跑SDXL的演示视频。
在Jupyter中,演示者让SDXL画一个「玩具老黄」。
此时的SDXL还不知道「玩具老黄」是个啥玩意儿。
于是演示者现场用8张图对模型进行了微调。
微调后重新绘制的作品,是不是有那味了?
除了上述两款大模型运行工具,英伟达还推出了最新版的企业软件平台NVIDIA AI enterprise 4.0。
软件包的数量达到了4500个,还有数以万计的相关依赖,而且安全可靠。
谷歌、微软、亚马逊、甲骨文等英伟达合作方都会在自己的云平台中集成这项服务。
「人类将成为一门新的编程语言」
除此之外,英伟达的计算机图形与仿真模拟平台Omniverse,也宣布了一系列新进展。
一方面,更多AI工具可以直接在Omniverse里面调用了。
包括对话式AI角色创建工具Convai、高保真AI动捕工具Move AI、AI低成本制作CG工具CGWonder Dynamics在内,一系列流行AI工具,现在都已经通过OpenUSD集成到Omniverse中。
就连Adobe,也计划将Adobe Firefly作为API,提供在Omniverse中(就是估计会收费)。
另一方面,英伟达还将生成式AI技术和OpenUSD结合,推出了一些好用的AI工具。
例如ChatUSD,就是一个基于NVIDIA Nemo框架大模型Copilot,不仅可以回答开发者有关USD的问题,还能帮忙生成Python-USD代码。
又例如DeepSearch,也是一个基于大模型的新工具,基于文本或图像输入,可以快速对数据库进行3D语义搜索。
在这次大会上,老黄先是回顾了自己过去所做的「正确决定」——用AI重塑CG,为AI重新发明GPU。
随后,他对未来AI行业的发展做了大胆的展望:未来,几乎所有事物的前方都会有一个大语言模型。「人」,将成为一种新的编程语言。
以工厂为例,老黄认为,未来的工厂将会由软件和机器人来「主宰」。
像汽车这样的产品,本身就是机器人,所以生产汽车的工厂,将会呈现出机器人制造机器人的场面。
看来,乘大模型东风迅速崛起的英伟达,这次是真的要ALL IN生成式AI了。
,老黄发布最强AIGC芯片!万户网络 “生成式AI的iPhone时刻已来”相关:
10米外都可以充电 丰田研发全新无线充电技术:2025年后问世快科技8月9日消息,日本丰田公司旗下的子公司丰田合成正在研发全新的无线充电技术,室内不使用电线的情况下,可以为5到10米外的智能手机等设备充电。丰田计划2025年之后在住宅中实际应用这项技术,目前正在跟美国初创企业Ossia联合研发所需的输电设备、显示微波动态的桌子等。丰田早在2018年就研发过手机无线充电技术,可将手机放置在驾驶与副驾之间的扶手箱上充电,但当时的技术还需要手机与之接触。丰田现在研发的可为10米外的..
一波未平一波又起?AI大模型再出邪恶攻击工具AI大模型的快速向前奔跑,让我们见识到了AI的无限可能,但也展示了AI在虚假信息、深度伪造和网络攻击方面的潜在威胁。据安全分析平台Netenrich报道,近日,一款名为FraudGPT的AI工具近期在暗网上流通,并被犯罪分子用于编写网络钓鱼电子邮件和开发恶意软件。黑客在售卖页表示,该工具可用于编写恶意代码、创建出“一系列杀毒软件无法检测的恶意软件”、检测网站漏洞、自动进行密码撞库等,并声称“该恶意工具目前已经售卖了超过3..
黄仁勋:“核弹工厂”即将上线,要让所有人用上生成式AI「20 年前我们推出了 RTX 显卡,5 年前我们将图形计算与 AI 结合,推出了「星战」Demo。」美国当地时间 8 月 8 日早上,英伟达创始人、CEO 黄仁勋在世界计算机图形会议 SIGGRAPH2023 上,开场回顾了英伟达在图形计算上的高光时刻,并且展示了最新的实时渲染的 4K 分辨率的 3D 赛车追逐 Demo。不过,仅仅几分钟后,「皮衣教主」的演讲,就从 3D 图形完全过渡到 AI 上了。作为人工智能浪潮中最重要的人物,..
麻生太郎主动要求会面,郭台铭送其“金门和平宣言”中国台湾网8月9日讯 日本前首相麻生太郎8月7日至9日窜访中国台湾地区,据台媒报道,离开台湾之前,他还特别约见了台湾鸿海集团创办人郭台铭,至此,四位对2024台湾地区领导人选举有意向的台湾政治人物都与麻生太郎会面了。郭台铭特别带了“金门和平宣言”到麻生太郎在台下榻酒店拜访,表示“台海要和平,要备战同时也要能够避战,要找出对话的基础”。郭还透露,是麻生太郎通过台外事部门通知他,希望在走前能够见一面,并且送..
“孤岛”汤家庄村的离别与团聚封面新闻记者 郝莹 杨峰滴嗒嗒一声响过,卫星电话成功连上信号。拿着电话的两名通信抢修人员身边呼啦啦围上来一圈村民。李燕举着快要没电的手机查找号码,电话接通后,她连声“喂”了三四遍,听到对面的女孩应声,才对着手机喊道,“喂,我是你妈,咱们家没事,你们都没事吧?”不等对面反应过来,两句话交代了家里有水有粮,李燕便告诉女儿,“不说了,他们都等着打呢。”挂断电话后,她擦着眼角走到一边。8月4日,这是灾后失..
又见游客被困无人区,“不专业”真的会要命救援现场。海西州公安局微信公众号 图继“4人自驾罗布泊不幸遇难”后,又一起旅游事故引发关注。8月6日,青海海西州公安局指挥中心接到来自广东的报警电话,报警人称,其母亲等一行8人在青海旅游期间被困无人区,其中4名老人、2名儿童。好在在多支警力协作连夜搜寻下,8名游客在次日凌晨终于被找到,经医务人员检查身体状况良好,总算是化险为夷。这几位游客要前往的是冷湖,位于柴达木盆地西北边缘,这里有个老的石油基地。当..
麻生太郎窜台声称应“立足于战,强化威慑”,中方回应问:日本前首相、自民党副总裁麻生太郎日前访台期间声称应“立足于战,强化威慑”,中方对此有何评论?答:这是不自量力,胡言乱语。同时,这些说法干涉中国内政,破坏台海稳定,中方已向日方提出严正交涉。台湾是中国的台湾,解决台湾问题完全是中国内政。如果日方一些人执意把中国内政事务同日本的安全保障捆绑在一起,将再次把日本带入歧途。
国际锐评 | 谁是仁爱礁事件的幕后推手中国海警局8日公布了一则视频,画面显示中国海警船日前对非法闯入中国南沙群岛仁爱礁邻近海域的菲律宾船只,进行了警示性水炮喷射。人们可以清楚地看到,中国海警船吨位远大于菲方船只,但现场操作专业、克制。分析人士认为,这是为避免直接拦阻出现碰撞而采取的处置措施,既展示了中方维护国家主权和海洋权益的决心和能力,又顾全中菲关系大局,体现了一个大国的责任担当。中国海警依法驱离菲非法进入我仁爱礁邻近海域船只 视..
新华时评:“脱钩断链”挡不住各国发展诉求新华社北京8月9日电 题:“脱钩断链”挡不住各国发展诉求新华社记者樊宇南非外交部副总司长、南非金砖国家事务协调人阿尼尔·苏克拉尔日前表示,南非不会屈服于美国压力而停止使用华为公司的网络通信设备。在美国打压围堵华为等中国企业、强拉遏华“小圈子”的政治喧嚣声中,南非做出了理性务实的选择,从中也不难看到这样一种风向:越来越多的国家开始认识到,追随美国对华“脱钩断链”行不通,立足自身发展才是优先逻辑。2017..
6次申请“入常”被否决,印度何以成为“推特五常”?✪ 詹丹妮北京大学区域与国别研究院【导读】2023年9月,第78届联合国大会将在纽约召开。印度媒体近期声称:如果印度今年不能“入常”,就将退出联合国,成立一个以印度为中心的“新联合国”。据悉,印度迄今已6次向联合国申请“入常”,但均被否决。与此形成对照的,是印度因常在国际舆论场上积极发表各类政见、努力展现自我,而被调侃为“推特五常”“油管五常”。为什么印度在国际舆论场上如此有存在感?本文分析,缘于庞大人..