文|白 ? 鴿?
編|王一粟
受AI大模型市場需求的爆發(fā),及外部市場環(huán)境影響,國產(chǎn)AI芯片市場迎來爆發(fā)期。
沐曦股份、摩爾線程、壁仞科技等多家芯片企業(yè)先后IPO,燧原科技也完成了上市輔導(dǎo),國產(chǎn)AI芯片迎來了“資本化大年”。
2026年1月1日,百度官宣旗下昆侖芯科技正式向港交所遞交上市申請。
此消息一出,2026年第一個交易日,百度的股價也終于揚眉吐氣了一回。港股單日大漲9.35%,美股更是飆升15.56%,市值單日增長超500億港元。
盡管昆侖芯已獨立運營,但其早已滲透進(jìn)百度的核心業(yè)務(wù),成為支撐核心搜索、大模型訓(xùn)推的底座,更是被深度集成在百度智能云中,成為必不可缺的一環(huán)。
無論傳統(tǒng)云競爭還是當(dāng)下的AI云競爭,云廠商之間最終比拼的,都是全棧體系能力。AI云時代,這種全棧能力的比拼進(jìn)一步加劇。尤其隨著一眾Agent應(yīng)用加速落地,自研芯片只是贏下未來競爭的敲門磚,唯有那些建起從芯片、算力,到模型、應(yīng)用的全棧AI云廠商,才有望在這場牌局中留到最后。
“一個再好的硬件都有它的局限性,而一個好的軟件系統(tǒng)的設(shè)計才能最大程度發(fā)揮硬件的上限?!币晃籄I框架開源社區(qū)負(fù)責(zé)人對光錐智能稱。
頭部玩家的布局早已印證這一趨勢。
如,百度智能云構(gòu)建昆侖芯+百舸AI計算平臺+千帆模型及Agent開發(fā)平臺+應(yīng)用組合,阿里云則推進(jìn)神龍計算架構(gòu)+飛天操作系統(tǒng)+PAI平臺的整合。
在三年AI大模型搶跑賽之后,一場圍繞全棧能力的新一輪競爭,已在AI云市場全面拉開帷幕。
自研GPU,一流云廠商的必備能力
昆侖芯的殺出,并不是黑馬爆冷,而是一種長期投入的必然。
以前,“租算力”是云服務(wù)的核心范式,云廠商的勝負(fù)手集中在算力規(guī)模的大小與高峰時期的靈活調(diào)用能力,企業(yè)只需按需租賃資源,即可滿足日常計算需求。
但隨著AI大模型加速滲透產(chǎn)業(yè),這種傳統(tǒng)模式已然難以為繼。
企業(yè)對算力的訴求早已超越“有無”,轉(zhuǎn)向“可靠”與“可用”:浙江政務(wù)云招標(biāo)明確要求“7×24小時安全運營服務(wù)”,招商銀行則強(qiáng)調(diào)云平臺可用性需達(dá)99.999%。
這背后的核心變化是,AI大模型的訓(xùn)練與推理不僅需要海量算力支撐,更要求基礎(chǔ)設(shè)施能穩(wěn)定交付、安全可控。
于是,“自研”“可控”成為云廠商們繞不開的關(guān)鍵詞,“自研GPU”不再是云廠商們單純的成本或性能選擇,而是戰(zhàn)略的必選項。
放眼國內(nèi)外,從亞馬遜到谷歌,一流的云廠商,都在自研AI芯片。
如亞馬遜于2015年開始芯片自研之路,并陸續(xù)發(fā)布Trainium系列芯片產(chǎn)品,其在2025年12月發(fā)布的Trainium 3加速器芯片,現(xiàn)已在部分?jǐn)?shù)據(jù)中心完成部署。
谷歌的芯片自研之路以 ASIC(專用集成電路)為核心方向,自2018年開放TPU(Tensor Processing Unit)供客戶使用以來,已迭代至第七代,憑借系統(tǒng)級效率與成本優(yōu)勢,成為英偉達(dá)最強(qiáng)勁的挑戰(zhàn)者,甚至意圖構(gòu)建可與之分庭抗禮的“谷歌鏈”生態(tài)。
從亞馬遜到谷歌,全球一流的云廠商的動向,折射出了整個云計算市場技術(shù)的趨勢。同時,中國頭部云廠商們,也都在強(qiáng)化自研芯片上的布局。
作為國內(nèi)最早布局AI的廠商,百度在生成式AI爆發(fā)之前,就已啟動昆侖芯的研發(fā)。
2011年,百度啟動FPGA AI加速器項目,最初只是為了降低搜索業(yè)務(wù)的GPU采購成本。2021年,昆侖芯開始獨立運營,先后推出了昆侖芯1代、2代和P800等產(chǎn)品。
其當(dāng)前主力產(chǎn)品P800芯片采用三星7nm工藝,F(xiàn)P16算力達(dá)345TFLOPS,單機(jī)8卡即可運行671B參數(shù)的超大模型。
更關(guān)鍵的是,其解決了國產(chǎn)芯片集群部署難的行業(yè)痛點。?
2025年2月,百度智能云正式點亮昆侖芯萬卡集群,標(biāo)志著其自研芯片實現(xiàn)規(guī)?;渴穑瑸锳I大模型的訓(xùn)推提供了自主可控的硬件基礎(chǔ)。同年4月,百度智能云點亮國內(nèi)首個三萬卡全自研集群,有效訓(xùn)練時長超99.5%,線性加速比達(dá)96%,能穩(wěn)定支撐超大規(guī)模AI模型訓(xùn)練需求。
與依賴第三方芯片的云廠商不同,昆侖芯的研發(fā)始終圍繞AI場景的核心需求展開,從架構(gòu)設(shè)計階段就與文心大模型的訓(xùn)練推理特性深度綁定,形成了“芯片適配模型,模型反哺芯片”的協(xié)同進(jìn)化模式。
IDC數(shù)據(jù)顯示,2024年,百度昆侖芯出貨量達(dá)6.9萬片,在國產(chǎn)AI芯片中僅次于華為昇騰,穩(wěn)居第一梯隊。
而在滿足基礎(chǔ)算力需求后,一個好的自研GPU芯片,也間接能夠助力云廠商在市場中的擴(kuò)張。
全棧能力,云廠商新一輪的競爭焦點
硬件強(qiáng)如英偉達(dá),芯片的性能已經(jīng)是當(dāng)前行業(yè)中的天花板,但想要真正發(fā)揮其性能效率,則還需要與英偉達(dá)CUDA軟件系統(tǒng)進(jìn)行搭配,才能夠?qū)崿F(xiàn)最高利用率。
同樣,云廠商本身就是通過“軟件和硬件”的鏈接和協(xié)同,把超大規(guī)模計算集群的能力發(fā)揮出來,所以這種鏈接和協(xié)同的效率就尤為關(guān)鍵,尤其是在AI時代。
這也正是全棧布局的意義。
全棧布局,絕非芯片、模型、平臺的簡單疊加,而是通過技術(shù)鏈路的深度融合,突破單一環(huán)節(jié)的性能瓶頸,最終實現(xiàn)“1+1>2”的效果。
前文也提到,目前全球頭部云廠商都紛紛加碼基礎(chǔ)設(shè)施建設(shè),打造了從底層基礎(chǔ)設(shè)施到工具鏈,再到上層應(yīng)用的全棧AI云能力。
可以看到,AI時代,云廠商們的競爭已經(jīng)進(jìn)入下半場,軟硬協(xié)同的全棧AI云能力,是新一輪競爭的焦點。
如果說,昆侖芯是百度智能云的“硬底座”,那么軟硬件的深度協(xié)同就是其“軟實力”的核心。
百度智能云以昆侖芯為基礎(chǔ),構(gòu)建了底層AI算力資源池,但想要真正最大效率的發(fā)揮這些算力資源,就還需要于上層軟件生態(tài)形成深度融合。
這種協(xié)同效應(yīng),從底層芯片設(shè)計之初就已開始。
據(jù)悉,昆侖芯從2018年起就與百度飛槳深度學(xué)習(xí)框架深度綁定,飛槳為昆侖芯提供了龐大的開發(fā)者生態(tài)支撐;而昆侖芯的硬件優(yōu)化,又讓飛槳框架的運行效率得到極致提升。
真正讓這些硬件潛力充分釋放的,則是百度智能云的百舸AI計算平臺。
百舸不像傳統(tǒng)資源池那樣只做調(diào)度,而是深入到底層網(wǎng)絡(luò)、內(nèi)存管理、通信協(xié)議中去重構(gòu)效率。比如,自研HPN網(wǎng)絡(luò)支持10萬卡RDMA互聯(lián),端到端延遲壓縮至4μs;針對MoE模型打造X-Link協(xié)議,顯著提升專家間通信效率。
值得注意的是,百舸在英偉達(dá)CUDA兼容方面已達(dá)到甚至超越部分頭部企業(yè),在部分場景下開發(fā)者從英偉達(dá)GPU切換到昆侖芯只需要改一行代碼,這意味著客戶的遷移成本幾乎可以忽略不計。
計算之上,是AI開發(fā)。
在百舸之上,千帆大模型平臺則將百度的大模型能力封裝為標(biāo)準(zhǔn)化服務(wù),企業(yè)用戶通過簡單的API調(diào)用,即可獲得優(yōu)化后的大模型能力,同時還可以為開發(fā)者提供Agent開發(fā)所需要的模型、Agent編排、數(shù)據(jù)和企業(yè)級能力。
可以看到,從底層芯片,到中間算力調(diào)度平臺、大模型深度學(xué)習(xí)框架,再到上層的MaaS服務(wù)平臺,百度智能云已經(jīng)構(gòu)建了全棧AI云能力。
目前,全球范圍內(nèi),僅有谷歌等少數(shù)科技公司能實現(xiàn)這種垂直整合,而百度是國內(nèi)少數(shù)真正跑通全棧閉環(huán)的云廠商。
目前,65%央企、100%系統(tǒng)重要性銀行及800+金融機(jī)構(gòu)、TOP 10手機(jī)廠商、中國市場銷量TOP15汽車品牌、TOP10新能源車企等,以及主流具身智能企業(yè),在落地大模型時都選擇了百度智能云。
如在能源領(lǐng)域,國家電網(wǎng)、南方電網(wǎng)等企業(yè)采用昆侖芯構(gòu)建的算力平臺,實現(xiàn)了電網(wǎng)調(diào)度的智能化優(yōu)化,提升了能源利用效率;在制造領(lǐng)域,吉利汽車、比亞迪等車企通過百度智能云的全棧方案,推動了無人駕駛技術(shù)的研發(fā)與落地。
在這其中,自研GPU也是客戶選擇的一個重要考量。
比如,央國企、金融等行業(yè)企業(yè)在部署AI大模型時,會更傾向于使用國產(chǎn)AI芯片,這才能更安全、更合規(guī)。
另外,企業(yè)對云廠商的需求,不僅僅是考慮大模型API價格,更重要的是算力的系統(tǒng)穩(wěn)定性、運行效率等疊加起來的,最終的整體運營成本。
而一套真正全棧自研的體系,不僅在成本上具有優(yōu)勢,更在整體運營效率上有更強(qiáng)的競爭力。
未來,隨著國產(chǎn)化替代的加速與智算平權(quán)的到來,全棧能力將不再是頭部云廠商的“加分項”,而是立足市場的“必選項”。
決戰(zhàn)AI云下半場,長期主義的勝利
科技競賽,從來都不是一城一地的得失,而是長期投入的比拼。
谷歌最早押注AI,收購DeepMind、成立AI實驗室、自研芯片,十幾年來從未停止投入,已經(jīng)成功在兩代AI上保持領(lǐng)先身位。
英偉達(dá)更是早在1999年就推出了首款被明確稱為GPU的產(chǎn)品GeForce 256?,徹底改變了圖形計算模式。?二十年間,不斷迭代硬件架構(gòu)、完善軟件生態(tài),最終形成了超級算力帝國。
任何一家企業(yè),能夠在激烈的市場爭奪中成為行業(yè)的頭部,背后一定是對技術(shù)有著長期主義的堅持和積累。
云計算市場同樣如此。2025年,云廠商紛紛都在爭搶AI云市場“第一”。
日前,有媒體統(tǒng)計了今年以來公開市場的大模型相關(guān)招投標(biāo)信息。相關(guān)數(shù)據(jù)顯示,2025年1-11月,中國主流云廠商大模型相關(guān)中標(biāo)項目累計達(dá)291個,中標(biāo)金額突破21億元。
其中,百度智能云以95個中標(biāo)項目和7.1億元中標(biāo)金額,成為中標(biāo)項目數(shù)和中標(biāo)金額最多的云廠商,火山引擎、阿里云則位列二三位。
借助AI大模型的機(jī)遇,百度智能云正在迎來加速增長和能力躍遷的機(jī)遇窗口。
而這背后,都是堅持長期主義的結(jié)果。
百度近十年在AI領(lǐng)域的研發(fā)投入累計超1800億元,2019年至2024年研發(fā)費用連續(xù)保持在220億元以上,核心研發(fā)投入占比長期維持在20%以上。
這種不計短期回報的投入,讓昆侖芯從2011年的一個內(nèi)部項目成長到進(jìn)入國產(chǎn)AI芯片第一梯隊,文心大模型從2019年迭代至如今的高效能版本,飛槳框架成為國內(nèi)份額第一的深度學(xué)習(xí)平臺,最終形成了技術(shù)護(hù)城河。
而2025年11月,百度智能云推出的超級智能體“伐謀”,更是為未來十年在智能體賽道有一席之地埋下了一粒種子。
路雖遠(yuǎn)行則必至,長期投入的收獲正在逐漸顯現(xiàn)。
2025年Q3,百度首次單獨披露AI業(yè)務(wù)收入,同比增長超過50%,AI云收入同比增長33%,AI高性能計算基礎(chǔ)設(shè)施的訂閱收入同比暴增128%,AI原生營銷服務(wù)同比增長262%達(dá)到28億元。
值得一提的是,在其AI云收入中,來自于AI高性能計算基礎(chǔ)設(shè)施的訂閱實現(xiàn)暴漲,而這背后離不開昆侖芯帶動的營收增長。
縱觀百度智能云營收增長情況,可以看到,2023年生成式AI爆發(fā)以來,文心一言大模型的發(fā)布,帶動了百度智能云的新一輪加速增長。
而在下一個階段,由昆侖芯、百舸、千帆、伐謀等所支撐的軟硬件全棧能力,或許能幫百度智能云在下一輪競爭中跑得更快更遠(yuǎn)。
蒸汽機(jī)從原理成熟到規(guī)?;瘧?yīng)用耗時百余年,電力革命也歷經(jīng)近一個世紀(jì),而AI作為更復(fù)雜的技術(shù)變革,更是一場馬拉松式的競速長跑。這場長跑的勝利,一定屬于長期主義者。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)