造核弹显卡,已经不能满足英伟达了

2023-08-10 19:30:12 来源:网络

每年 8 月,英伟达都会在全球最重要的计算机图形会议 SIGGRAPH 上秀一秀「肌肉」。

五年前,英伟达 CEO 黄仁勋在 2018 SIGGRAPH 发布了首款支持光线追踪的显卡 Quadro RTX,这是英伟达自 G80 以来最重要的产品,把英伟达 GPU 从 GTX 时代推向了 RTX 时代。

彼时,英伟达还是一个非常纯粹的图形计算芯片厂商,满脑子想的都是怎样把 3D 渲染推向极致,其市值约为 814 亿美元,还没进入千亿俱乐部。

但到了 2023 年,英伟达经历了脱胎换骨般的巨变。3 月份的 GTC 大会上,老黄抛出了金句「AI 的 iPhone 时刻已经到了」之后,英伟达的股价便开始节节攀升,不断刷新历史新高。

这五年之间,英伟达的股价涨了近 10 倍,当前市值已突破 11000 亿,成为全球第一家市值突破万亿美元的芯片公司,也是当前市值仅次于苹果、微软、Alphabet、亚马逊的美股第五大科技股。

英伟达的显卡在市场上依然抢手,只是现在争相抢购 GPU 的不再是那群追求极致画面的游戏玩家,而是微软、Meta 等急着部署和训练大模型的科技巨头。

在昨晚的 2023 SIGGRAPH 上,你已经再难听到老黄说出游戏、实时渲染、3D 等耳熟能详的关键词,取而代之的是生成式 AI、数据中心、加速计算等概念。

这是全新的英伟达,也是一个全新的时代。

英伟达变了

我们可以从英伟达的财报解读这是一家怎么样的公司。

很长一段时间里,游戏业务一直是英伟达主营业务,直到 2023 年第一财季,在 PC 市场消费低迷和 AI 计算升温的双重影响下,英伟达的数据中心业务终于迎头赶上,成为了英伟达第一收入来源,这也标志着英伟达正式从传统的 GPU 供应商转型成了全球最大的算力供应商之一。

在这之后,英伟达的数据中心开始一路狂飙,其 H100、A100 等计算显卡成了 AI 行业的硬通货,一度出现严重短缺。有分析师推测,全世界可能需要 43.2 万张 H100 才能满足市场需求。

英伟达最新一季的财报显示,得益于企业们的强烈需求,英伟达的数据中心业务在 Q1 的营收约为 42 亿,同比增长了 14%,环比增长了 18%,超出华尔街的预期。

但如果你觉得英伟达只是碰巧被 AI 热钱砸中的幸运儿,那也太小看老黄了。

对英伟达来说,造「核弹 GPU」、投入 AI,这些不过是实现他们最终愿景的所要做的「准备工作」,英伟达真正想要做的,是建设一个真正的元宇宙。

最先进的「锄头」

工欲善其事,必先利其器,英伟达深谙此理。

今年 3 月,英伟达发布了 H100 NVL GPU、L4 Tensor Core GPU、L40 GPU 以和 NVIDIA Grace Hopper 四款 AI 推理芯片,以满足企业们日益增长的算力需求。

5 月的台北电脑展上,老黄发布了用 256 个 NVIDIA GH200 Grace Hopper 超级芯片组成的超级计算机 DGX GH200。

而就在昨天,老黄又发布了搭载 HBM3e 内存新版 GH200,甚至连上一代的 GH200 还没正式出货,更新速度快得吓人。

新旧 GH200 之间的差异主要集中在内存上。

GH200 Grace Hopper 是世界上首个搭载 HBM3e 内存的 GPU 芯片,内存容量从每个 GPU 96 GB 扩展到 144 GB,增加了 50% 。

HBM3e 内存是一种新型的高带宽内存技术,在运算速度上 HBM3e 能比 HBM3 运算速度快 50%,提供最高 5TB/秒的传输速率。 这让新版本的 GH200 运行 AI 模型的速度比当前模型快 3.5 倍。

其中,双配置的 GH200 内存能达到 282 GB 的 HBM3e 内存,相比上一代的容量增加了 3.5 倍,带宽增加了 3 倍。相比抢手的 H100,内存则增加了 1.7 倍,带宽增加 1.5 倍。

和上一代一样,新 GH200 也有着近乎夸张的拓展性。

得益于英伟达的 NVLink 互联技术, GH200 根据企业的需求组合成不同规模的形态,单卡、双卡、多卡服务器、机柜、甚至的超级计算机都没问题。

最终,GH200 可以组合成 256 张卡的 DGX GH200 SuperPod 超级计算机,拥有了 144 TB 的快速内存,每秒可以执行 10 的 18 次方次浮点运算。

如果这还不能满足你的需求,还可以用 Nvidia Quantum-2 InfiniBand Switch 交换机让多个 Nvidia DGX GH200 SuperPod 相连。

老黄打趣说道:「这下应该能带得动《孤岛危机》了。」

强大的拓展性为 GH200 的未来提供无限可能。

换而言之,想要提升运算速度,那么只需要添置更多的服务器机柜就能达成。这非常有利于在未来黄仁勋认为,未来 GH200 的典型应用场景就是大语言模型,并且「加速运算」、「AI 运算」将逐渐取代传统 x86 GPU 的「通用计算」。

举个例子,过去 1 亿美元预算,只能够建设一个小的数据中心,购买 800 个 x86 GPU,并用 5 兆瓦的电力来运作。

但同样的预算下,选择加速计算的 Grace Hopper 只需要消耗 3 兆瓦的电力,而且数据吞吐量还能提高一个数量级。而如果以同样的工作量来计算,Grace Hopper 计算方案只要 800 万美元。

说到了这里,老黄又抛出了他的名言:「你买的越多,省的也就越多。」

官方预计,新款 GH200 需要等到 2024 年的第二季度上市。搭载 HBM3 内存的 GH200 将按原计划在今年下半年陆续出货。

当然,对于个人开发者和小团队来说,要搭建动辄上亿的数据中心并不现实,为此英伟达「贴心」地推出了集成先进 RTX 技术的新一代工作站显卡:NVIDIA RTX 5000 、NVIDIA RTX 4500 以及 NVIDIA RTX 4000。

其中,作为旗舰级别 GPU,NVIDIA RTX 5000 采用了第 4 代 Tensor Core 和第 3 代 RT Core,相比上一代 GPU,单精度浮点运算性能提升了 2 倍,达到了 90 TFLOPS 的峰值,配备高达 32GB 的 GDDR6 视频内存,支持 ECC 错误校验,适用于高端工作站、数据中心和云游戏。

而作为中高端级别 GPU,NVIDIA RTX 4500 配备 24GB GDDR6 视频内存,也支持 ECC 校验。

相比前一代产品,NVIDIA RTX 4500 光线追踪性能提升 1 倍,AI 处理性能提升 2 倍,其性价比非常突出,适合创意专业用户、小型工作站等使用场景。

NVIDIA RTX 4000 则采用了与 RTX 4500 相同的 GPU 核心,配备 20GB GDDR6 视频内存,其光线追踪和 AI 计算性能都有大幅提升。

目前全新的 NVIDIA RTX 5000 GPU 已经发售,而 NVIDIA RTX 4500 和 RTX 4000 GPU 将在今年下半年陆续出货。

最肥沃的「土地」

套用农夫山泉的广告词,我们可以这样介绍英伟达最新的 AI 策略:

我们不生产 AI,我们只是 AI 的搬运工。

众所周知,本地配置 AI 模型是件繁琐、复杂的差事,为了帮助开发人员解决这个难题,老黄宣布,英伟达将推出「AI Workbench」。

简单来说,AI Workbench 可以一站式地为开发者提供配置 AI 模型所需的框架、工具开发包等环境,直接就可以开始创建项目。

老黄在现场举了一个非常形象的例子。

比如说,公司需要配置一个 Stable Diffusion 模型来作画,但是你既没有硬件设备,又不懂得怎么配置模型。

不用着急,这时候你只要打开 AI Workbench,选择一个 4 个 RTX 6000 Ada GPU 的云工作站,然后就能一键配置 Stable Diffusion 模型。

要是你对生成出来的图片不满意,你还可以自己上传图片,重新训练模型后再生成。

不用一分钟,一张像模像样的图片就生成出来了,全程你不用操心其他问题,因为 AI Workbench 已经把别的都准备就绪了。

英伟达宣布,将会与 AI 开源平台 Hugging Face 建立战略合作关系,将这一技术也被应用到了企业端。

只需在 Hugging Face 平台中简单点击几下,开发者即可轻松地将生成式 AI 项目从笔记本电脑到工作站,再转移到数据中心或云端,最终借助 NVIDIA DGX 云 AI 超级计算资源来训练 AI 模型。

老黄强调,通过与 Hugging Face 的合作,英伟达最先进的 AI 技术可以为各行各业提供支持。企业也可以利用开源社区的力量,按照企业的规划需求推进 AI 的训练。

最宏大的「梦想」

介绍完了软硬件平台的更新,老黄长吁一口气说道:「让我们聊聊今晚最重要的话题——OpenUSD。」

OpenUSD 对大多数人来说应该是一个陌生的名词。OpenUSD 是皮克斯(是的,拍动画的那个皮克斯)在 2015 开源的一个框架,在此之前皮克斯已经使用这个框架超过 10 年,我们看过的很多动画都是基于 OpenUSD 框架制作的。

OpenUSD 可以理解为是一个创建 3D 世界用于描述、组合、模拟和合作的通用标准,老黄将之比作为「HTML 之于 2D 网页的意义」「真正地把整个世界凝聚了在一起」。

就在上周,皮克斯、 Adobe 、苹果、 Autodesk、英伟达,以及 JDF 宣布成立 OpenUSD 联盟 (AOUSD) ,以促进 OpenUSD 标准化、开发、演变和发展。

为什么这个名不见经传的名字能让这么多不同领域的巨头公司聚集在一起?这要从 3D 工作的工作流程说起。

3D 工作流程非常精细且复杂,例如设计师、艺术家和工程师都在 3D 工作流程的某个部分上有所专长,如建模、纹理、材料、物理模拟、动画、布景设计和合成等。

由于他们使用的工具(PS、AutoCAD、Blender 等)是由不同的公司开发的,很多文件格式并不能互相兼容,导致用户要频繁地导出、转换格式、导入,繁琐不说还容易损坏内容。

OpenUSD 正是为了解决这些问题而生的技术,通过 OpenUSD,Adobe Stager、Houdini、Maya、Blender、Renderman、Pixar 的 Minuteman 和 Epic 的 Unreal Engine 等工具都能互通数据,发挥出更强大的作用。

随后,老黄郑重宣布英伟达的 Omniverse 将成为第一个完全为 OpenUSD 打造的平台,从底层的数据库到引擎系统,每一行代码都是以 OpenUSD 为中心设计的。

不仅如此,英伟达还一同推出了 RunUSD、ChatUSD 和 DeepSearch 等 API,将进一步降低开发者构建基于 OpenUSD 应用的门槛,让 3D 工作流程可以与 AI 等技术结合起来。

举个例子,全球最大的广告公司 WPP 为比亚迪的腾势 N7 制作的广告,就是在「元宇宙」拍的。

WPP 把腾势 N7 的高精 CAD 数据上传到了 Omniverse 上,制作了一个数字孪生汽车,然后 WPP 的艺术家可以在 Omniverse 的环境里进行创作。

例如可以调用 ChatUSD API,只需要输入一句话描述,就能让 AI 生成不同的背景环境,从而创作出用于全球营销活动的数千条个性化的内容片段。

元宇宙和生成式 AI 就像是天生一对的搭档,当两者相遇后,其价值将会被指数级放大,而 OpenUSD 技术让这一切变为了可能。

老黄认为,未来还会有越来越多的产业需要经历数字化转型,Omniverse 和人工智能即将会成为这些企业们完成数字化转型时最重要的工作流。

而要搭建 Omniverse 和人工智能,自然离不开强大的算力支持,这便是英伟达真正的形态:

以 GPU 为骨、AI 为肤,组成推动工业数字化转型最有力的手。

,造核弹显卡,已经不能满足英伟完税证明 达了

相关:

老人与物业沟通后倒地身亡市民郑先生说,他于去年6月在温泉豪园买了套房,目前装修进入收尾阶段。“我爸爸跟物业张主任因为装修的事情有一些口角,因为我们把一些瓷砖和木头堆在最角落的楼梯间,她要求我们马上把东西清理掉。”郑先生表示,阶段性的装修结束后,屋内要先清理出部分垃圾,而多余的瓷砖等也需要用在后续的修补上,因此才暂时堆放于楼梯间,“不会影响居民行走”。18日,张主任联系郑先生妻子,要求清理。由于要上班,她便委托郑先生父亲代..

让外媒夸赞的“合肥模式”,能否被其他城市成功复制?英国《经济学人》8月5日刊发长篇评论文章,深入分析中国安徽省合肥市的城市发展路径,称“合肥模式”是城市经济发展的最重要动力,并为中国其他城市发展提供实践范例。那么,远在大洋彼岸的英国媒体究竟是如何观察和评论,他们眼中的“合肥模式”呢?文章开篇描述,如果漫步于合肥的“量子大道”,将可以看到两旁分布着全世界最为集中的尖端科技企业,主要为几年前还不存在的量子计算产业链。而这些在全球都属于顶级的科技企业却..

公安部提醒:有效保护个人信息 做到“三个不”  中新网8月10日电 10日,公安部召开新闻发布会,公安部网络安全保卫局警务技术二级总监黄小苏表示,公安机关坚持宣传引导和打击治理两手抓、同促进,在加大传统媒体宣传力度的基础上,利用各类新媒体账号开展宣传,大力宣传公安机关打击侵犯公民个人信息犯罪工作成效,向群众普及个人信息保护知识,揭批最新犯罪手法。   同时,持续构建部省市县联动宣传“矩阵”,通过组织线下宣传周、宣传讲座、新闻发布会等,推动个人..

清华发布大模型性能报告:GPT-4第一 更懂中文的还是百度快科技8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先,微软、谷歌、Meta紧随其后,国内科技巨头也迅速跟进,现在国内据说已经有上百款大模型问世了。这么多大模型中,实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,将国内外的大模型做了一番对比。该报告还探讨了这些模型在不同知识领域,如创意写作、代码编程、舆情分析、历史知识等方面的回答情况,以及其在解决实际问题中..

肌霸猪到底会让多少人羞愧?黑皮,翘臀,肌霸。你很难想象这样的是猪。要说猪能练成施瓦辛格,不如说鱼会破鳞成蝶。看到这场面,我意识到自己想象力的局限以及大自然的漫无边界。挖掘潜能,拓宽边界的行事做派很好,当今社会正需要这样的复合型人才。但凡事得有个度,太过了搞得不伦不类邯郸学步,何苦呢。本来吃吃睡睡等死,却长一身的腱子肉,看客是嫉妒了,自己却搞得很累。硬邦邦的,毫无用武之地,站着躺着都不舒服,要这肌肉有毛用。肌霸猪就是这样一..

河北涿州211个进水村已全部退水  8月9日,河北省涿州市通报抗洪抢险有关情况。经初步统计,涿州全市47万余人受灾,农作物受灾面积28621公顷。截至目前,全市402个村,191个村未受灾,211个村进水,已全部退水。   涿州境内主要有永定河、白沟河、北拒马河、小清河、琉璃河、胡良河6条行洪河道,145个傍河村,2个蓄滞洪区。今年以来,涿州全市累计降雨量524.7毫米。7月29日8时至8月2日8时,过程平均雨量358.7毫米,较常年相比增多4.4倍,最大累计降雨量442..

绘就中华文明传承发展的“长城画卷”  绘就中华文明传承发展的“长城画卷”   ——北京长城文化带保护传承利用调研与思考   编者按   万里长城气魄雄伟,是世界上最伟大的工程之一。长城不仅是中华民族精神的象征,也是传承和弘扬中华文化的重要载体。2019年8月,习近平总书记强调:要做好长城文化价值发掘和文物遗产传承保护工作,弘扬民族精神,为实现中华民族伟大复兴的中国梦凝聚起磅礴力量。为守护好这一宝贵文化遗产,近年来,北京以长城文化带保..

吉林:抢险救灾和灾后恢复工作同步有序开展  “注意放线的高度,别缠在一起,线夹要固定好……”8月8日早上7点20分,在吉林省敦化市额穆镇十里堡村,国网敦化供电公司额穆供电所员工邹义文和同事们正忙着抢修线路。   抢修队员们一大早就集合赶路,在道路被洪水冲断的地方下车,手拿肩扛设备绕行山路。邹义文表情坚定地说:“水退到哪里,电就送到哪里;受灾群众安置到哪里,光明就要照亮哪里!”   这是吉林省全力抗洪救灾抢险中温暖的剪影。连日来,受台风“杜..

洪灾袭来险情急 科技撑起“保护伞”  ◎本报记者 都 芃   受季风、台风等因素影响,每年的7月下旬和8月上旬,民间俗称“七下八上”,是我国东部地区降水最为集中的时期,也是我国抗洪防汛的关键时间。今年进入7月下旬后,受台风影响,我国东部地区普遍遭遇强降水天气。   城市作为建筑物密集、人员高度集中的区域,在遭遇强降雨时往往存在内涝风险。为了尽可能降低城市内涝带来的不利影响,最大限度保障人民生命和财产安全,近年来各类科技手段被广泛应..

每小时制水5吨 “移动水厂”确保涿州饮用水高质高量  现场检测145项指标,每小时制水5吨   “移动水厂”确保饮用水高质高量   ◎本报记者 陈汝健   “应急送水车来啦,快排好队,准备接水。”上述情景,是记者8月9日下午在河北省涿州市冠云西路上的华北铝业南院生活小区门口所见的一幕。   “自8月2日起,我们先后从国家供水应急救援中心西北基地和东北基地调配了8辆应急制水车。”在位于涿州市的华北铝业有限公司厂区制水点,中国城市规划设计研究院水务院工程师..