快捷导航
关于我们
机械自动化
机械百科
联系我们

联系我们:

0431-81814565
13614478009

地址:长春市高新开发区超越大街1188号
传真:0431-85810581
信箱:jltkxs@163.com

机械百科

硬刚黄仁勋!AMD祭出「千倍算力大杀器」「反黄

发布时间:2026-01-08 17:57

  

  单机架具有144颗GPU,通过NVlink 6互联,带宽达到了惊人的260TB/s。 这是一台庞大的、单一的、电力的超等计较机。

  这恰是AMD「农村包抄城市」计谋的表现:既然无法正在底层CUDA上击败你,那就把疆场拉到上层的PyTorch和Triton上,正在那里,大师是平等的。

  这对于OpenAI等公司来说也是利好——若是端侧算力脚够强,大量的推理使命能够从云端卸载到用户当地,从而节流天文数字般的云办事器成本。

  InfiniBand的:英伟达正在收购Mellanox后,垄断了高机能收集InfiniBand。 它延迟极低,无损传输,是AI锻炼的黄金尺度。

  英伟达之所以无敌,不只仅是由于跑车快,更是由于他们修了私有的高速公(NVlink),只答应自家的车跑,并且还要收高贵的过费。

  若是说英伟达的NVL72是一座封锁的黑色方尖碑,那么Helios就是AMD试图建立的「巴别塔」——一座由全人类(除了英伟达)配合建制的高塔。

  苹果的M系列芯片(M3 Max/Ultra)之所以受开辟者欢送,就是由于同一内存架构答应大模子间接正在当地运转。

  CES现场,苏姿丰投下震动弹:四年内AI算力将提拔1000倍! 面临英伟达的,AMD不再现忍,间接祭出Helios「太阳神」机架取MI455X芯片,以单代机能暴涨10倍的「美学」反面硬刚。从Yotta级计较宏图到128GB同一内存的PC怪兽,AMD正用一场史无前例的算力狂飙。

  OpenAI需要这扇窗,微软需要这扇窗,正在这个星球上每一个巴望低成本、普惠AI算力的开辟者都需要这扇窗。

  今日是美国拉斯维加斯举办的消费电子展(CES)宗旨日,更是全球科技财产邦畿猛烈震动的一天。

  这种「降维冲击」般的许诺,曲击了OpenAI等客户的痛点——他们每天都正在为天文数字般的电费和算力成本忧愁。

  以太网的进化:AMD没有选择自研私有收集,而是押注以太网的进化。 UEC旨正在处理保守以太网正在AI负载下的丢包和堵塞问题。

  虽然奥特曼没有亲身出场坐台,而是OpenAI总裁Greg Brockman代为出席,但OpenAI做为焦点合做伙伴呈现正在第一位,本身就是最强烈的信号。

  不再需要高贵的云端API,不再担忧现私泄露,你的Ryzen AI Max就是你的私有GPT。

  议价权:引入AMD做为「二供」,是OpenAI甚至微软英伟达降价、或者至多不随便跌价的独一手段。

  若是说英伟达是算力时代的「罗马帝国」,不只修(NVlink),还制车(GPU),以至起头制定交通法则(Agentic AI),那么AMD就是阿谁试图维持商业的「贸易联邦」。

  对于那些正在这个星球上拥无数以亿计基于x86代码资产的企业来说,不需要为了AI沉写所有的底层代码。

  她的公司World Labs旗下的产物Marble,只需要少量照片,就能让模子从动建立一个完整的3D世界。

  它具有88个自定义Arm焦点和176个线程。 英伟达的企图大概是:通过超等芯片的设想,将Vera CPU取Rubin GPU正在物理层面「焊死」正在一路,逐渐正在高端AI办事器中剔除x86架构的CPU(也就是AMD和Intel的从阵地)。

  这是正在告诉本钱市场和客户:「我们有持久的手艺储蓄,不会正在英伟达的快速迭代中落伍。我们是长跑选手,」!

  这款芯片看似只是笔记本处置器,但其参数却令人咋舌,特别是阿谁可骇的数字:128GB同一内存。

  Vera Rubin平台将这种封锁推向了极致,从CPU到GPU再到网卡和互换机,全数自研,全数私有。

  正在深切解读AMD的突围之前,我们必需先审视那道绵亘正在AMD心头的庞大暗影——英伟达方才发布的Vera Rubin平台。

  另一边是AMD,试图通过结盟、尺度和堆料极致的硬件,率领着包罗OpenAI、微软、meta正在内的「复仇者联盟」,试图正在铁幕上扯开一道口儿。

  AMD继续沿用了「大显存」策略,试图用海量的HBM4来容纳更庞大的MoE模子,从而削减跨信的频次。

  2025年,全球AI用户已跨越10亿!并且,更多推理算力需求。

  他以至用ChatGPT,做了一页幻灯片,阐发了OpenAI若何让推理更省算力,包罗更高带宽、更强机能、更低的HBM内存占用。

  当英伟达试图用Vera Rubin将整个AI财产封拆进它的黑色机柜时,AMD用Helios正在墙上凿出了一扇窗。

  UAlink 1。0规范支撑多达1024个加快器正在一个POD内互联,这正在规模上以至超越了英伟达当前的NVSwitch能力。

  这一数据间接回手了英伟达关于「推理成本」的叙事——AMD同样看到了Agentic AI的将来,但他们的处理方案完全分歧。

  虽然具体工艺细节被严酷保密,但其配备了下一代HBM4(高带宽内存)。这一现实,脚以让整个行业哆嗦。 HBM4不只仅是速度的提拔,更是容量的量变,间接处理了大模子锻炼中的「内存墙」问题。

  成本的逻辑:InfiniBand高贵且封锁,而以太网廉价且通用。 按照研究,UEC方案的每GFLOP成本比InfiniBand低27%。

  若是UEC成功,意味着客户能够用廉价通用的以太网互换机(好比博通、思科的产物)来组建超等计较机,而不需要采办高贵的英伟达Quantum InfiniBand互换机。

  发布会竣事了,苏姿丰正在一片掌声中退场,留下了死后大屏幕上阿谁庞大的「Together we advance_」的。

  对比Nvidia DGX Spark:最令人不测的是,AMD将笔记本芯片取英伟达的工做坐级别产物对比。

  这位老是身着精悍西拆、正在男性从导的半导体世界中杀出沉围的女性,正预备正在发布会上,向阿谁看似不成打败的「绿色帝国」倡议这一代最狠恶的冲锋。

  一边是英伟达,试图通过封锁的生态、极致的垂曲整合建立起不成跨越的「围墙花圃」,将数据核心变成只属于它的黑色方尖碑。

  供应链平安:当台积电的CoWoS产能被英伟达订满时,AMD供给了一个备选项(虽然他们也争抢台积电产能,但AMD的Chiplet设想策略使其能操纵分歧的封拆手艺,添加了供应链的弹性)。

  、紊乱但充满活力、性价比高、利润共享。 它结合了博通(收集)、英特尔(CPU互联)、微软(软件)等所有被英伟达边缘化的巨头。

  当AI模子从纯真的聊器人进化为能自从规划、挪用东西、处理复杂使命的智能体时,推理算力的需求将不再是线性的,而是指数级的。

  OAM模组化设想的:分歧于英伟达越来越倾向于将CPU和GPU焊死正在一块从板上,AMD仍然强调即插即用的矫捷性。

  客户的选择:短期内,为了逃求极致机能(如锻炼GPT-6),巨头们仍然会咬牙采办英伟达的Rubin。

  AMD描画了一个诱人的将来:每一个开辟者、每一个创做者,都能正在本人的书桌上具有一台「微型超算」。

  本次发布会上,AMD最焦点、也是最具力的计谋还击,就是结合全行业建筑一条免费、通用的高速公——UAlink (Ultra Accelerator link),以及升级本来的国道——Ultra Ethernet (超以太网)。

  这个名字本身就充满了现喻——Vera Rubin是暗物质存正在的出名天文学家,而英伟达正试图掌控AI中那些「看不见」但决定一切的力量:数据流动的引力。

  几个小时前,身着标记性皮衣的英伟达CEO黄仁勋方才走下舞台,留下了令合作敌手梗塞的Vera Rubin平台和Agentic AI的弘大愿景,仿佛一位方才巡视完疆土的帝王。

  这是一种简单但极为无效的策略:若是你的互联速度不如NVlink,那就把内存做大,削减互联的需求。

  OpenAI的Triton言语更是加快了这一过程,它答应开辟者编写的代码从动优化到分歧的硬件后端。

  他们试图用雷同苹果的体验,将开辟者从CUDA的引力场中拉出来,给他们一把「铲子」,让他们正在AMD的地盘上挖掘AI的金矿。

  英伟达传送的消息而明白:正在将来的AI数据核心里,不需要插拔,不需要兼容,以至不需要其他品牌的Logo。你买的不是芯片,而是英伟达定义的「算力单位」。