遲到10分鐘,黃仁勛身穿標(biāo)志性的黑色夾克,走上拉斯維加斯國際消費電子展(CES)的舞臺。
黃仁勛總結(jié)剛剛走過的一年,尤其提到了開源的崛起起到的催化劑作用,而DeepSeek R1的出現(xiàn)意外地推動了整個行業(yè)的一年。
整個演講持續(xù)一個半小時,比起幾年前宣布開啟“AI的iPhone時刻”的震撼感,如今的英偉達(dá)聽起來更像是兢兢業(yè)業(yè)的世界“基礎(chǔ)設(shè)施部”——這是芯片,這是機(jī)架,這是網(wǎng)絡(luò),這是軟件……哦對了,你們總說的那些機(jī)器人和汽車,理論上都要跑在這一整套東西之上。
這其中,今年CES的一條清晰主線,是對“全棧控制”的執(zhí)念,尤其集中在存儲,以及英偉達(dá)反復(fù)強(qiáng)調(diào)的下一個瓶頸:具備代理能力(agentic)的AI。
它們需要更長的上下文、更大的內(nèi)存、更強(qiáng)的網(wǎng)絡(luò),以及更少諸如“現(xiàn)實世界跑不起來”的借口。
英偉達(dá)給出的說法是,“AI工廠”已經(jīng)成為一個新的產(chǎn)品類別,而他們打算出售的不只是設(shè)備,而是藍(lán)圖、機(jī)器、操作系統(tǒng),以及其余所有組成部分。
黃仁勛所公布的很多內(nèi)容,其實已經(jīng)流傳了好幾個月——Blackwell之后的Rubin架構(gòu)、作為DPU躍遷的BlueField-4、英偉達(dá)號稱“開放”的Nemotron模型家族、作為安全框架的Halos。
真正的新意在于打包方式。英偉達(dá)正在把這條路線圖壓縮成一個完整論點:六款芯片,一個平臺,再加上網(wǎng)絡(luò)和“上下文內(nèi)存”的底層管道,目的是讓長時序智能體不再輕易卡死。
01
基礎(chǔ)設(shè)施
在硬件層面,最核心的故事是:Rubin正在被拆解成可直接交付的“積木式”組件。
英偉達(dá)發(fā)布了一套由六個部分組成的Rubin“平臺”——包括Rubi和Rubin Ultra兩種規(guī)格的GPU與CPU,以及NVLink 6交換芯片和ConnectX-9 SuperNIC。
所有關(guān)于性能和“單token成本”的說法,都是建立在這種全系統(tǒng)協(xié)同設(shè)計之上,目標(biāo)只有一個:壓低“智能”的成本。
在系統(tǒng)層面,英偉達(dá)將Vera Rubin NVL72定位為機(jī)架級的主力產(chǎn)品(72顆GPU、36顆CPU),而Rubin Ultra NVL288則是體量更大的后續(xù)版本(288顆GPU、144顆CPU)。
同時,英偉達(dá)還把Rubin納入DGX品牌的“AI工廠”體系中,將用于訓(xùn)練的DGX Rubin NVL72與用于推理的DGX Rubin NVL8組合成更標(biāo)準(zhǔn)化、更即插即用的算力單元。
英偉達(dá)表示,基于Rubin的產(chǎn)品將于2026年下半年通過合作伙伴上市。
這里有兩項基礎(chǔ)設(shè)施層面的“外掛”在默默發(fā)揮關(guān)鍵作用。
第一,英偉達(dá)正把網(wǎng)絡(luò)當(dāng)作一項一等性能特性來強(qiáng)調(diào),主推Spectrum-X以太網(wǎng)光子交換系統(tǒng),并給推理性能和能效都貼上了“提升五倍”的標(biāo)簽。
第二,英偉達(dá)試圖把“長上下文”塑造成一次基礎(chǔ)設(shè)施采購決策,推出了名為“推理上下文內(nèi)存(inference context memory)”的存儲平臺,用來擴(kuò)展具備代理能力的AI的上下文窗口。
如果說Rubin的潛臺詞是“這條路線圖真的行”,那么圍繞它的這套底層管道系統(tǒng)的潛臺詞就是:“下一個利潤池,將在GPU之外?!?/p>
02.
開放模型
英偉達(dá)的“開放模型”敘事,與其說是出于意識形態(tài)上的覺醒、加入開源運動,不如說是一種更務(wù)實的策略:
用“免費樣品”把開發(fā)者吸引進(jìn)自家生態(tài)——而這些樣品被精心打包,目的就是在英偉達(dá)基礎(chǔ)設(shè)施上跑得最好。
正如英偉達(dá)生成式AI與軟件副總裁Kari Briski所說,這是一次“擴(kuò)展”。
公司將其包裝成一個整體方案:全新的Nemotron-3模型(包括70B、34B和8B三種規(guī)模的Llama Nemotron-3變體),再加上一批新數(shù)據(jù)集和工具,幫助團(tuán)隊構(gòu)建垂直領(lǐng)域智能體,并通過英偉達(dá)的技術(shù)棧完成部署。
“在2025年,英偉達(dá)是Hugging Face上最大的貢獻(xiàn)者之一——發(fā)布了650個開放模型和250個開放數(shù)據(jù)集。”Briski表示。
核心意思很明確:英偉達(dá)希望成為你開始的地方。
英偉達(dá)稱,其正在發(fā)布Nemotron-CC,這是一個多語言預(yù)訓(xùn)練語料庫,覆蓋140多種語言,總規(guī)模達(dá)1.4萬億token,被定位為構(gòu)建和微調(diào)模型的“開放”基礎(chǔ)層。
公司同時強(qiáng)調(diào)了一套名為“Granary”的指令數(shù)據(jù)集,目標(biāo)是讓模型在企業(yè)級任務(wù)上“開箱即用”。
03
物理AI與機(jī)器人
英偉達(dá)不斷把“物理AI”描述為一個分水嶺時刻:當(dāng)“智能體”不再只是能聊天,而是真正具備能力。也就是說,感知、推理和行動需要被放進(jìn)同一個閉環(huán)里。
這意味著需要三塊打底的積木:更好的仿真、更好的機(jī)器人模型,以及更好的“運動(mobility)”模型。
黃仁勛在一份新聞稿中表示:“機(jī)器人領(lǐng)域的ChatGPT時刻已經(jīng)到來。”
他認(rèn)為,那些“能夠理解現(xiàn)實世界、進(jìn)行推理并規(guī)劃行動”的模型,正在打開“全新的應(yīng)用場景”。
也正因如此,汽車行業(yè)或許成了英偉達(dá)“全?!睌⑹碌恼嬲嚱鹗@是一個“演示”和“落地”之間隔著監(jiān)管、責(zé)任風(fēng)險,以及十多年反復(fù)受挫的樂觀預(yù)期的領(lǐng)域。
英偉達(dá)稱,其用于輔助駕駛的Drive AV平臺已“進(jìn)入量產(chǎn)階段”,將搭載于2026款梅賽德斯-奔馳CLA車型。該車型在2025年獲得了Euro NCAP的最高安全評分。
英偉達(dá)表示,這款車具備“先進(jìn)的L2級自動駕駛能力”,支持“點到點的城市導(dǎo)航”,包括“從地址到地址”的完整行程;同時將Hyperion定位為提供安全冗余的計算與傳感器架構(gòu)。公司還稱,該車型將在今年年底前具備在美國道路上脫手駕駛的能力。
更大的賭注在后面。
“我們相信,物理AI和機(jī)器人最終將成為全球最大的消費電子品類,”英偉達(dá)汽車業(yè)務(wù)副總裁Ali Kani表示,“所有會移動的東西,最終都會實現(xiàn)完全自動化,由物理AI驅(qū)動。”
Kani介紹稱,Alpamayo是英偉達(dá)面向自動駕駛推出的一整套“開源AI模型、仿真工具和物理AI數(shù)據(jù)集”家族,目標(biāo)是加速“基于推理、以安全為核心的物理AI開發(fā)”。
英偉達(dá)同時發(fā)布了1700小時的駕駛數(shù)據(jù),并配套一個開源仿真框架,將其定位為邁向L4級自動駕駛的入門工具包。
在機(jī)器人方面,英偉達(dá)重點提到了Isaac GR00T N1.6——一個面向機(jī)器人技能的開放式“視覺–語言–行動”推理模型,以及用于大規(guī)模測試策略的評估框架Isaac Lab Arena。
公司還提及Cosmos Reason 2,這是一個旨在提升物理推理能力的模型,而整個Cosmos系列則被定位為生成合成數(shù)據(jù)、用于訓(xùn)練物理AI的工具鏈。
與此同時,英偉達(dá)將Jetson T4000定位為機(jī)器人的邊緣計算平臺,并與同一條從訓(xùn)練到部署的流水線相連,最終回流至DGX級基礎(chǔ)設(shè)施。
英偉達(dá)正在努力讓“機(jī)器人技術(shù)?!笨雌饋硐瘛败浖夹g(shù)棧”:在它能生成的世界里訓(xùn)練,在它能變化的世界里測試,并最終部署在它自己出售的硬件之上。
從更宏觀的角度看,英偉達(dá)在CES上釋放的信息在這三大板塊中高度一致:未來屬于“流水線”,而英偉達(dá)希望這條流水線的每一個環(huán)節(jié)——算力、網(wǎng)絡(luò)、存儲、安全、仿真——都運行在它已經(jīng)出售的產(chǎn)品之上。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)