美国加州圣何塞春光明媚,一年一度的英伟达GTC大会如期而至。这里已经被整座城市的“英伟达绿”渲染得热情似火:从大街小巷到公共交通,再到餐厅商铺,无处不在的GTC标识让人仿佛置身于一场有关AI的“嘉年华”。在这次盛会上,英伟达创始人兼CEO黄仁勋“皮衣战甲”再度闪耀,一系列关于AI、芯片、云计算、物理AI等颠覆性发布
黄仁勋在演讲一开始,就用他标志性的幽默方式展现了对AI未来的雄心——一连抛出覆盖未来4年、跨越3代GPU架构的重磅路线图,让无数人直呼“信息量太大,脑子不够用”。那么,本届GTC带来了哪些关键看点?本文将为您一一梳理。
本届GTC上的首要亮点,非新一代数据中心旗舰GPU——Blackwell Ultra(GB300)莫属。它采用多裸片先进封装,将两块掩模尺寸大小的GPU拼装在一起,形成一个多达288GB HBM3e显存的“巨型核心”,令FP4推理性能最高可达15PFLOPS。
英伟达提出,Blackwell Ultra主要面向AI推理时代,尤其是当今大模型中最炙手可热的“思维链推理”“深度思考推理”等应用场景。训练、后训练与推理可以在同一系统内协同完成。与此同时,Blackwell Ultra构建了极强的I/O带宽及网络互联能力:借助新的Spectrum-X以太网和Quantum-X800 InfiniBand平台,每个GPU带宽可达800Gb/s,无缝支持大规模多卡并行,让一个机架内的多块GPU宛如一块大型GPU。
在系统方案层面,英伟达带来了GB300 NVL72机架和HGX B300 NVL16两大新品。前者在一个机架内整合72块Blackwell Ultra GPU与36个Grace CPU,构成一个FP4推理峰值算力高达1.1EFLOPS的高密度AI系统;后者是面向训练与推理的HGX系统,支持弹性分配、流水线并行、张量并行等多种并行模式,对“大模型三驾马车”——预训练、微调、推理都能提供强劲支持。
根据英伟达对比显示,与上一代Hopper平台相比,HGX B300 NVL16在大语言模型上的推理速度提升最高11倍,计算能力提升7倍,显存容量增加4倍,真正为深度思考模型、复杂MoE模型带来了性能飞跃。
如果说Blackwell Ultra是今年的焦点,那么英伟达对于未来的预告则引爆了全场的惊叹:黄仁勋提前披露了下一代Rubin GPU架构,以及整合Rubin GPU和Vera CPU的Vera Rubin超级芯片,并宣布将于2026年、2027年陆续亮相,更远则在2028年推出Feynman(费曼)平台。
Rubin与Rubin Ultra将采用全新的HBM4、HBM4e显存,并协同新一代Arm架构的Vera CPU实现更大规模的数据并行处理。黄仁勋强调,从Hopper到Blackwell到Rubin再到Faynman,英伟达将每年迭代AI系统与网络模块,始终走在前列,让AI工厂面对动辄万亿级别参数模型时,依旧能顺畅运行。
英伟达在GTC上更新了自家AI超算旗舰——DGX SuperPOD,通过内置的新一代DGX GB300和DGX B300系统,让公司能够一站式搭建高性能AI基础设施。英伟达宣称,基于最新的Blackwell Ultra或Grace Blackwell组合,DGX SuperPOD可将AI工厂性能提升至70倍,真正意义上实现了“大模型时代”下的弹性超算。
为了让企业用得更省心,英伟达带来了NVIDIA Instant AI Factory托管服务。公司能够像使用云主机一样,直接租用搭载Blackwell Ultra的DGX SuperPOD完成AI训练、推理任务。此外,英伟达还发布了Mission Control软件,让数据中心能够更轻松地监控、管理和编排AI工作负载。
Equinix等合作伙伴将率先在全球45个城市提供预配置液冷或风冷环境,帮助用户“即插即用”,快速开启AI工厂之旅。
本届GTC上,黄仁勋在硬件大展拳脚的同时,也重磅推出AI推理软件Dynamo,并开源了Llama Nemotron推理模型系列。由此,英伟达在推理端也开始搭建起新的“操作系统”,辅助企业和开发者跑出更高效、更低成本的推理任务。
NVIDIA Dynamo被称作“AI工厂的操作系统”,是一个开源的AI推理软件,专为大模型推理和分布式部署设计。它通过智能分区、动态调度、缓存管理等机制,把数千个GPU的协同效率发挥到极致。在DeepSeek-R1这样的中国大模型上,Dynamo可将每块GPU生成的token数量提高30倍以上,大幅度提高整体吞吐量并降低推理成本。
黄仁勋尤其强调,如今大模型推理属于“极限计算”,需要在速度、吞吐量、延迟和成本间实现综合平衡,Dynamo就是为此而生。它兼容PyTorch、SGLang、vLLM和TensorRT-LLM等主流框架,帮企业快速做大规模部署。
在大模型领域,英伟达宣布Llama Nemotron系列正式开源,提供Nano、Super、Ultra三个版本。其中Super 49B版本在生成速度和AI智能体任务准确率方面都超过了DeepSeek-R1和Llama 3.3 70B,可为用户所带来5倍的吞吐量增益。Nemotron可本地部署在DGX Spark、DGX Station以及OEM服务器上,也能集成至任何AI智能体框架,赋能企业级AI应用。
黄仁勋在GTC还官宣了两款个人AI超算——全球最小AI超算DGX Spark和桌面级AI超算DGX Station,让本地开发者再不用仰望动辄数百台GPU的机房,也能拥有“贴身”的高性能深度学习与推理平台。
DGX Station:基于Blackwell Ultra的桌面级AI超算,单机拥有高达784GB统一系统内存,并支持800Gb/s超高速网络连接,AI性能可达20PFLOPS。它将数据中心级算力“直接搬到你桌面上”,为需要大模型本地训练或推理的开发者提供“究极生产力”。
黄仁勋表示,Blackwell目前产能、销量都在不断飙升,销售量是上一代Hopper的3倍。之所以如此火爆,还在于大模型与智能体应用的爆发,推理所需的token规模已经远超预期。黄仁勋甚至笑称:“有人担心Hopper会因此被淘汰,但别急,大规模应用下Hopper依然价值不菲。”
数据显示,全球四大云厂商已向英伟达采购超过360万块Blackwell GPU,远超于去年130万块Hopper的销售额。英伟达认为,未来AI的计算需求将继续保持指数级增长,而Blackwell正好卡住了大模型训练与推理的核心入口。
随着AI工厂的规模从数百块GPU扩展到数万、数十万甚至上百万块GPU,网络通信成了瓶颈。为此,英伟达在本届GTC上宣布了共封装光学(CPO)交换机与硅光网络交换机技术——Spectrum-X和Quantum-X Photonics,令1.6Tb/s端口速率成为可能,并宣称可将AI工厂扩展到数百万块GPU。
Quantum-X Photonics InfiniBand:主打144个800Gb/s端口,带宽达115.2Tb/s,并采用液冷技术,速度是上代的2倍、扩展性是上代的5倍。硅光子+液冷+模块化可拆卸设计,也让网络更节能、更高效。
“AI的下一波浪潮是物理AI。”黄仁勋在GTC上郑重宣布英伟达对机器人领域的最新探索。他发布了Isaac GR00T N1人形机器人基础模型,并宣布与迪士尼研究院、谷歌DeepMind携手合作,开发开源物理引擎Newton。
GR00T N1:开源、预训练且可定制的人形机器人模型。其设计灵感来自“System1+System2”的认知双系统架构:快速反应与慢速深度推理相结合,可加速人形机器人对环境的理解与动作控制。
Newton物理引擎:与迪士尼研究院、DeepMind联手开发,将帮助机器人模拟触觉、运动、执行器控制等真实物理现象,提升仿真与真实场景的映度。黄仁勋认为,这正是将AI扩展到物理世界不可或缺的基石。
作为演示彩蛋,“迪士尼机器人Blue”还在演讲结尾亮相,展现对“老黄”的亲昵互动,吸引众多目光。
英伟达预判6G将是AI原生的无线网络,需要更强的AI解决能力、更高的频谱效率和更强的自适应能力。黄仁勋透露,英伟达正与T-Mobile、Cisco等公司合作,通过NVIDIA AI Aerial平台搭建下一代电信系统,将“AI工厂”思路引入无线通信领域。
通用汽车(GM)宣布将与英伟达深度绑定,为旗下汽车与工厂注入“GM AI”,合作覆盖生产端的数字孪生模拟、车机端的AI辅助驾驶等多个环节。黄仁勋还正式推出了全栈无人驾驶安全系统NVIDIA Halos,强调AI在真实场景中的安全与审查,承诺对无人驾驶技术的每行代码进行第三方安全检测。
“买得越多,赚得越多”——这个带货名言黄仁勋在本届GTC上再次拿来“调侃”,却也精准点出了AI时代“推理”将成为终极计算的核心:推理的高成本和高收益并存,每提升一倍推理效率,就能为行业带来更多价值。
英伟达选择以一年一更的快节奏迭代,筹备从Blackwell到Rubin、从Rubin到Feynman平台的惊人路线图,向世人昭示了构建“AI工厂”的宏大野心;也通过开源软件Dynamo、Nemotron模型等,打造更完善的生态体系。能预见,当新一轮AI推理浪潮在全世界内崛起,无论是云上还是本地,任何一个人都能拿到“随时随地的AI生产力”,为更多产业注入想象力。
如果你觉得这篇文章对你起到一定的帮助,欢迎点赞、收藏以及转发分享。同时,请关注我,以获取更多关于人工智能的最新资讯和见解!
大象新闻记者近日,知名“打拐志愿者”上官正义接到知情人举报称,在湖南省长沙市下辖一村庄有非法的手术室和实验室,暗地开展地下业务,非法进行取卵手术和受精卵培育等交易。
中方代表团介绍中美经贸高层会谈有关情况:双方都同意建立中美经贸磋商机制
当地时间5月11日,中方代表团在日内瓦举行新闻发布会,介绍中美经贸高层会谈有关情况。当地时间5月10日至11日,中美双方在瑞士日内瓦举行经贸高层会谈。中方代表团在新闻发布会上表示,双方就彼此关心的经贸问题开展了深入交流。
在5月9日举行的俄罗斯纪念苏联伟大卫国战争胜利80周年阅兵式上,大量俄军武器装备在红场亮相引发各界高度关注。从S-400防空导弹系统、“伊斯坎德尔”战术导弹与“亚尔斯”洲际弹道导弹等传统大杀器,到首次亮相的“天竺葵-2”无人机,这些装备集中体现了哪些特点?
当地时间5月10日至11日,中美经贸中方牵头人、国务院副总理何立峰与美方牵头人、美国财政部长贝森特和贸易代表格里尔在瑞士日内瓦举行中美经贸高层会谈。双方围绕落实1月17日中美元首通话重要共识进行了坦诚、深入、具有建设性的沟通,达成一系列重要共识,会谈取得实质性进展。
5月12日,湖南长沙,长沙窝点执法现场,多名涉事人员翻墙逃跑,执法人员迅速抓回5名人员
防空导弹击落防空导弹 巴基斯坦的红旗防空系统到底有多强? #红旗防空系统 #s400防空系统 #军事 #印巴冲突 #武器装备
“阵风”败北法国冤不冤?完整空战系统只有中美 #抖音热评 #法国阵风战斗机
经江西省委批准,江西省纪委监委对江西省第十五届委员会委员、江西省市场监督管理局原党组书记、局长谢来发涉嫌严重违纪违法问题进行了立案审查调查。
#长文创作激励计划#据印媒报道称,印度民众在霍希亚尔普尔发现了巴基斯坦发射的中国 PL-15E 导弹的残骸,从公布的视频来看,这枚导弹大部分都是完整的,尾舵、发动机、弹体中部的短翼都非常完整,此前在社会化媒体上已然浮现多次残骸,包括天线、制导舱甚至T/R单元,这不禁让很多网友都非常
致力于分享最新的人工智能技术、应用和趋势,让你深入了解AI的无限可能性。
电话: 134-5561-6515
地址: 山东省潍坊市昌乐