色和倘视频一二三区观看视频,日韩高清AV一区二区

DoNews > 專欄 > 谷歌Gemini最“小”的一次迭代，姚順宇為何高呼“不可阻擋”？

谷歌Gemini最“小”的一次迭代，姚順宇為何高呼“不可阻擋”？

字母榜 2026-02-23 18:57:39

10306

分享到

人們還在津津樂道OpenAI和Anthropic兩家公司的老板拒絕牽手，以至于握拳高舉的滑稽畫面，另一邊，谷歌一個反手迭代了模型。

而且這次迭代，頗像是狼披上了羊皮——從模型后綴的數(shù)字序號看，這是谷歌最“小”的一次迭代，之前都是從Gemini 2.0到Gemini 2.5這樣的迭代，這次從Gemini 3.0到Gemini 3.1Pro Preview。

但是這“.1”的迭代，進步得卻不是一星半點。

谷歌CEO皮查伊（Sundar Pichai）表示，新代模型非常擅長處理“超級復(fù)雜的任務(wù)”。例如將復(fù)雜概念可視化、將數(shù)據(jù)綜合成單一視圖或者將創(chuàng)意項目變?yōu)楝F(xiàn)實。

姚順宇也專門在X上發(fā)帖為Gemini 3.1 Pro Preview振臂，盛贊：

“Gemini不僅僅是一個好模型，更好的模型正在以不可阻擋之勢到來?！?/p>

需要注意的是，大約一周前，谷歌推出了“專用推理模式”Gemini 3 Deep Think，專為科學(xué)、研究、工程等復(fù)雜、開放式問題設(shè)計。

Demini 3 Deep Think是姚順宇從Anthropic跳槽到谷歌DeepMind之后參與的第一個項目。

而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千絲萬縷的關(guān)系，官方表示“直接構(gòu)建在Gemini 3 Deep Think的經(jīng)驗和技術(shù)之上”。相當于把Deep Think的核心推理提升技術(shù)“下放”到更廣泛可用的Pro模型中。

Gemini 3.1 Pro Preview能做什么

既然這次新代模型的突出能力在處理“超級復(fù)雜”的任務(wù)，那么普通的對話放一邊，谷歌的官方博文中，重點給出了幾種示例秀肌肉。

第一，通過簡單的提示詞，創(chuàng)建SVG動畫。

這個功能前代也有，但是對比之下進步明顯。

比如提示詞“生成一個SVG，描繪一只變色龍靜靜地坐在樹枝上。讓變色龍的眼睛跟隨用戶的鼠標光標在屏幕上移動?！?/p>

Gemini 3 Pro生成的動畫背景是單一的白色，變色龍也看起來很呆板，甚至一側(cè)有兩只眼睛。

Gemini 3.1 Pro生成的動畫則有豐富的“深綠色叢林”背景，變色龍身體有黃色斑紋和圓點裝飾，眼睛立體，腿部姿勢自然彎曲。

再比如提示詞“生成一個滑動切換開關(guān)的SVG，當鼠標懸停在太陽圖標上時，將其變成發(fā)光的月亮，同時背景從明亮平滑漸變到黑暗。采用干凈的扁平UI風(fēng)格?！?/p>

Gemini 3 Pro給出的動畫雖然完成了任務(wù)，圖標可以隨鼠標變化，但是主圖標單一，是一個缺角的圓形圖案，用黃色代表白天，白色代表夜間。

Gemini 3.1 Pro生成的動畫要復(fù)雜得多，白天是黃日白云，夜間是月牙繁星，兩套圖標絲滑變換。

總而言之，Gemini 3 Pro做的動畫，讓人想起多年前那個“學(xué)了三年動畫”的梗。

而Gemini 3.1 Pro交付的SVG動畫，已經(jīng)達到了可以直接使用的效果。

第二，構(gòu)建工程級別系統(tǒng)。

Gemini 3.1 Pro已經(jīng)可以根據(jù)一段高復(fù)雜度的自然語言指令，直接生成一個集3D渲染、實時太陽星歷計算、API異步拉取和物理光效于一體的完整交互系統(tǒng)，而不是簡單頁面demo。

谷歌給出的示例中，用戶給出文字指令，Gemini 3.1 Pro生成了構(gòu)建一個高保真、可交互的3D國際空間站（ISS）軌道追蹤器。使用高分辨率的Blue Marble紋理貼圖渲染一個精細的3D地球模型。

第三，生成交互式創(chuàng)意系統(tǒng)。

在另一個示例中，谷歌展示了Gemini 3.1 Pro編寫的一個復(fù)雜的3D椋鳥群舞（murmuration）模擬。

它不僅生成視覺代碼，還構(gòu)建了一個沉浸式體驗，用戶可以通過手部追蹤操控鳥群，并聆聽根據(jù)鳥群運動變化的生成式配樂。

對于研究人員和設(shè)計師而言，這提供了一種強有力的方式來原型化感官豐富的界面。

第四，將文學(xué)主題轉(zhuǎn)化為可運行的代碼。

這個示例可能是普通人也最容易get到厲害之處的一個。

當被要求為艾米莉·勃朗特（Emily Bront?）的《呼嘯山莊》（Wuthering Heights）打造一個現(xiàn)代個人作品集網(wǎng)站時，該模型并未簡單地總結(jié)文本內(nèi)容，而是基于小說的氛圍與情緒進行推理，設(shè)計出一個簡潔、當代感十足的界面，創(chuàng)建出一個捕捉主人公精神內(nèi)核的網(wǎng)站。

抽象推理，這種能力的含金量不用多說。

到底有多強？

新代模型免不了過一下刷榜這一步。

而“.1”的升級，獲得了動輒倍數(shù)躍升的成績。

根據(jù)谷歌官方博文放出的測試結(jié)果，

在ARC-AGI-2基準測試中，3.1 Pro的驗證得分達到了77.1%。比3 Pro的推理性能提升了一倍以上。

這也符合3.1 Pro的示例，因為這個測試評估的是模型解決全新邏輯模式的能力。用人話說就是，抽象推理解謎的能力。

此外，在GPQA Diamond（科學(xué)知識測試）中，3.1 Pro得分94.3%；智能體類基準MCP Atlas上，得分69.2%；真實網(wǎng)絡(luò)瀏覽與信息整合能力的基準BrowseComp上，得分85.9%。

這些成績，均超過了Anthropic的Sonnet 4.6、Opus 4.6，以及OpenAI的GPT-5.2與GPT-5.3-Codex。

谷歌Gemini 3.1 Pro這次在ARC抽象推理和BrowseComp搜索任務(wù)上顯著拉開差距，顯示出明顯的Agent傾向，而非單純知識模型。

此外，專門做大模型基準測試與對比分析的第三方評測機構(gòu)也發(fā)布了相關(guān)測試結(jié)果，大贊Gemini 3.1 Pro在構(gòu)成Artificial Analysis Intelligence Index的10項評測中領(lǐng)先6項，相較于Gemini 3 Pro Preview在多項能力上顯著提升，尤其是在推理與知識、代碼能力以及降低幻覺方面進步最大。

而且，Gemini 3.1 Pro Preview保持較高的token效率。

運行完整Artificial Analysis Intelligence Index約需5700萬token（比Gemini 3 Pro Preview多100萬）。

這一token使用量低于其他在最大推理模式下運行的前沿模型，如Opus 4.6（max）和GPT-5.2（xhigh）。

結(jié)合更低的單token定價，Gemini 3.1 Pro Preview在前沿模型中具有成本優(yōu)勢，運行完整Intelligence Index的成本不到Opus 4.6（max）的一半，不過仍約為領(lǐng)先開源模型GLM-5的兩倍。

能力翻倍價格不變

谷歌官方API定價顯示，Gemini 3 Pro/3.1 Pro Preview的收費結(jié)構(gòu)是按token計費的：

小于200k tokens時，每百萬token輸入約2美元，輸出價格為4美元。大于200k tokens時，每百萬token輸入4美元，輸出18美元。

在上下文緩存方面，根據(jù)提示詞規(guī)模，每百萬 token 收取 0.20 至 0.40 美元，外加每小時每百萬 token 4.50 美元的存儲費。

這個價格，整體上和Gemini自己的上一代3 Pro一致，但要是和 Anthropic Opus 系列比起來，還是相對便宜的。 Opus這類模型輸入/輸出單價能在$5/$25左右。

尤其是結(jié)合當下它在模型能力上相當突出，這個價格更顯得極具競爭力。

不要忘了，谷歌這次發(fā)布的只是“預(yù)覽（Preview）”，谷歌很快就會推出正式版。而“.1”的迭代，谷歌也是在暗示其只是小秀肌肉。

目前，開發(fā)者可以在AI Studio、Gemini API、Gemini CLI、智能體開發(fā)平臺Google Antigravity以及Android Studio使用3.1 Pro；企業(yè)用戶則可以在Vertex AI和Gemini Enterprise使用；普通用戶在Gemini應(yīng)用和NotebookLM都能用上，不過后者僅限Pro和Ultra訂閱用戶。

各個社區(qū)里已經(jīng)有不少人迫不及待上手操作，真的就和谷歌的演示一樣，手搓了不少驚艷的玩意。

有人用Gemini 3.1 Pro 生成了一個可交互的 3D 機械級汽車懸架系統(tǒng)模擬器，包含真實幾何結(jié)構(gòu)、連桿約束與實時轉(zhuǎn)向和行程計算，相當于把機械工程建模、物理邏輯和3D可視化一次性寫成可運行工具，接近工程級原型能力。

有人用3.1 Pro制作“捉鬼獵人走過一棟鬧鬼的房子”的循環(huán)動畫，驚呼“Gemini沒有開玩笑”。

總之，谷歌這回是真憋了個大招。

小小一個“.1”，卻把推理和代碼能力拉得飛起，定價還這么穩(wěn)。

社區(qū)里滿溢的手搓demo的熱情，也證明了它的能力與實用性。

AI圈越來越現(xiàn)實了。模型再強，終究得看賬單值不值。企業(yè)開始精打細算每個token的回報，開發(fā)者也得掂量掂量性價比。谷歌這一步，不僅是搶回王座，更是把競爭推向“誰更會過日子”的新階段。

且看接下來，捏著拳頭的Anthropic和OpenAI，以及xAI、Meta、微軟等一眾競爭對手該如何應(yīng)對吧。

特別聲明：本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點，不代表DoNews專欄的立場，轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)