在线中文AV精品人人草视频|日韩特黄AA片av超碰|国模免费在线视频|国产高清无码三级片|小毛片小电影人人上人人操|春色av无码黄片无码区|很爽很爽的香蕉视频|日本伊人小视频|亚洲AV网站免费|四月婷婷精品视频在线

谷歌Gemini最“小”的一次迭代,姚順宇為何高呼“不可阻擋”?

人們還在津津樂道OpenAI和Anthropic兩家公司的老板拒絕牽手,以至于握拳高舉的滑稽畫面,另一邊,谷歌一個反手迭代了模型。

而且這次迭代,頗像是狼披上了羊皮——從模型后綴的數(shù)字序號看,這是谷歌最“小”的一次迭代,之前都是從Gemini 2.0到Gemini 2.5這樣的迭代,這次從Gemini 3.0到Gemini 3.1Pro Preview。

但是這“.1”的迭代,進步得卻不是一星半點。

谷歌CEO皮查伊(Sundar Pichai)表示,新代模型非常擅長處理“超級復(fù)雜的任務(wù)”。例如將復(fù)雜概念可視化、將數(shù)據(jù)綜合成單一視圖或者將創(chuàng)意項目變?yōu)楝F(xiàn)實。

姚順宇也專門在X上發(fā)帖為Gemini 3.1 Pro Preview振臂,盛贊:

“Gemini不僅僅是一個好模型,更好的模型正在以不可阻擋之勢到來?!?/p>

需要注意的是,大約一周前,谷歌推出了“專用推理模式”Gemini 3 Deep Think,專為科學(xué)、研究、工程等復(fù)雜、開放式問題設(shè)計。

Demini 3 Deep Think是姚順宇從Anthropic跳槽到谷歌DeepMind之后參與的第一個項目。

而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千絲萬縷的關(guān)系,官方表示“直接構(gòu)建在Gemini 3 Deep Think的經(jīng)驗和技術(shù)之上”。相當于把Deep Think的核心推理提升技術(shù)“下放”到更廣泛可用的Pro模型中。

01

Gemini 3.1 Pro Preview能做什么

既然這次新代模型的突出能力在處理“超級復(fù)雜”的任務(wù),那么普通的對話放一邊,谷歌的官方博文中,重點給出了幾種示例秀肌肉。

第一,通過簡單的提示詞,創(chuàng)建SVG動畫。

這個功能前代也有,但是對比之下進步明顯。

比如提示詞“生成一個SVG,描繪一只變色龍靜靜地坐在樹枝上。讓變色龍的眼睛跟隨用戶的鼠標光標在屏幕上移動?!?/p>

Gemini 3 Pro生成的動畫背景是單一的白色,變色龍也看起來很呆板,甚至一側(cè)有兩只眼睛。

Gemini 3.1 Pro生成的動畫則有豐富的“深綠色叢林”背景,變色龍身體有黃色斑紋和圓點裝飾,眼睛立體,腿部姿勢自然彎曲。

再比如提示詞“生成一個滑動切換開關(guān)的SVG,當鼠標懸停在太陽圖標上時,將其變成發(fā)光的月亮,同時背景從明亮平滑漸變到黑暗。采用干凈的扁平UI風(fēng)格?!?/p>

Gemini 3 Pro給出的動畫雖然完成了任務(wù),圖標可以隨鼠標變化,但是主圖標單一,是一個缺角的圓形圖案,用黃色代表白天,白色代表夜間。

Gemini 3.1 Pro生成的動畫要復(fù)雜得多,白天是黃日白云,夜間是月牙繁星,兩套圖標絲滑變換。

總而言之,Gemini 3 Pro做的動畫,讓人想起多年前那個“學(xué)了三年動畫”的梗。

而Gemini 3.1 Pro交付的SVG動畫,已經(jīng)達到了可以直接使用的效果。

第二,構(gòu)建工程級別系統(tǒng)。

Gemini 3.1 Pro已經(jīng)可以根據(jù)一段高復(fù)雜度的自然語言指令,直接生成一個集3D渲染、實時太陽星歷計算、API異步拉取和物理光效于一體的完整交互系統(tǒng),而不是簡單頁面demo。

谷歌給出的示例中,用戶給出文字指令,Gemini 3.1 Pro生成了構(gòu)建一個高保真、可交互的3D國際空間站(ISS)軌道追蹤器。使用高分辨率的Blue Marble紋理貼圖渲染一個精細的3D地球模型。

第三,生成交互式創(chuàng)意系統(tǒng)。

在另一個示例中,谷歌展示了Gemini 3.1 Pro編寫的一個復(fù)雜的3D椋鳥群舞(murmuration)模擬。

它不僅生成視覺代碼,還構(gòu)建了一個沉浸式體驗,用戶可以通過手部追蹤操控鳥群,并聆聽根據(jù)鳥群運動變化的生成式配樂。

對于研究人員和設(shè)計師而言,這提供了一種強有力的方式來原型化感官豐富的界面。

第四,將文學(xué)主題轉(zhuǎn)化為可運行的代碼。

這個示例可能是普通人也最容易get到厲害之處的一個。

當被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》(Wuthering Heights)打造一個現(xiàn)代個人作品集網(wǎng)站時,該模型并未簡單地總結(jié)文本內(nèi)容,而是基于小說的氛圍與情緒進行推理,設(shè)計出一個簡潔、當代感十足的界面,創(chuàng)建出一個捕捉主人公精神內(nèi)核的網(wǎng)站。

抽象推理,這種能力的含金量不用多說。

02

到底有多強?

新代模型免不了過一下刷榜這一步。

而“.1”的升級,獲得了動輒倍數(shù)躍升的成績。

根據(jù)谷歌官方博文放出的測試結(jié)果,

在ARC-AGI-2基準測試中,3.1 Pro的驗證得分達到了77.1%。比3 Pro的推理性能提升了一倍以上。

這也符合3.1 Pro的示例,因為這個測試評估的是模型解決全新邏輯模式的能力。用人話說就是,抽象推理解謎的能力。

此外,在GPQA Diamond(科學(xué)知識測試)中,3.1 Pro得分94.3%;智能體類基準MCP Atlas上,得分69.2%;真實網(wǎng)絡(luò)瀏覽與信息整合能力的基準BrowseComp上,得分85.9%。

這些成績,均超過了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2與GPT-5.3-Codex。

谷歌Gemini 3.1 Pro這次在ARC抽象推理和BrowseComp搜索任務(wù)上顯著拉開差距,顯示出明顯的Agent傾向,而非單純知識模型。

此外,專門做大模型基準測試與對比分析的第三方評測機構(gòu)也發(fā)布了相關(guān)測試結(jié)果,大贊Gemini 3.1 Pro在構(gòu)成Artificial Analysis Intelligence Index的10項評測中領(lǐng)先6項,相較于Gemini 3 Pro Preview在多項能力上顯著提升,尤其是在推理與知識、代碼能力以及降低幻覺方面進步最大。

而且,Gemini 3.1 Pro Preview保持較高的token效率。

運行完整Artificial Analysis Intelligence Index約需5700萬token(比Gemini 3 Pro Preview多100萬)。

這一token使用量低于其他在最大推理模式下運行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。

結(jié)合更低的單token定價,Gemini 3.1 Pro Preview在前沿模型中具有成本優(yōu)勢,運行完整Intelligence Index的成本不到Opus 4.6(max)的一半,不過仍約為領(lǐng)先開源模型GLM-5的兩倍。

03

能力翻倍價格不變

谷歌官方API定價顯示,Gemini 3 Pro/3.1 Pro Preview的收費結(jié)構(gòu)是按token計費的:

小于200k tokens時,每百萬token輸入約2美元,輸出價格為4美元。大于200k tokens時,每百萬token輸入4美元,輸出18美元。

在上下文緩存方面,根據(jù)提示詞規(guī)模,每百萬 token 收取 0.20 至 0.40 美元,外加每小時每百萬 token 4.50 美元的存儲費。

這個價格,整體上和Gemini自己的上一代3 Pro一致,但要是和 Anthropic Opus 系列比起來,還是相對便宜的。 Opus這類模型輸入/輸出單價能在$5/$25左右。

尤其是結(jié)合當下它在模型能力上相當突出,這個價格更顯得極具競爭力。

不要忘了,谷歌這次發(fā)布的只是“預(yù)覽(Preview)”,谷歌很快就會推出正式版。而“.1”的迭代,谷歌也是在暗示其只是小秀肌肉。

目前,開發(fā)者可以在AI Studio、Gemini API、Gemini CLI、智能體開發(fā)平臺Google Antigravity以及Android Studio使用3.1 Pro;企業(yè)用戶則可以在Vertex AI和Gemini Enterprise使用;普通用戶在Gemini應(yīng)用和NotebookLM都能用上,不過后者僅限Pro和Ultra訂閱用戶。

各個社區(qū)里已經(jīng)有不少人迫不及待上手操作,真的就和谷歌的演示一樣,手搓了不少驚艷的玩意。

有人用Gemini 3.1 Pro 生成了一個可交互的 3D 機械級汽車懸架系統(tǒng)模擬器,包含真實幾何結(jié)構(gòu)、連桿約束與實時轉(zhuǎn)向和行程計算,相當于把機械工程建模、物理邏輯和3D可視化一次性寫成可運行工具,接近工程級原型能力。

有人用3.1 Pro制作“捉鬼獵人走過一棟鬧鬼的房子”的循環(huán)動畫,驚呼“Gemini沒有開玩笑”。

總之,谷歌這回是真憋了個大招。

小小一個“.1”,卻把推理和代碼能力拉得飛起,定價還這么穩(wěn)。

社區(qū)里滿溢的手搓demo的熱情,也證明了它的能力與實用性。

AI圈越來越現(xiàn)實了。模型再強,終究得看賬單值不值。企業(yè)開始精打細算每個token的回報,開發(fā)者也得掂量掂量性價比。谷歌這一步,不僅是搶回王座,更是把競爭推向“誰更會過日子”的新階段。

且看接下來,捏著拳頭的Anthropic和OpenAI,以及xAI、Meta、微軟等一眾競爭對手該如何應(yīng)對吧。

特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)

谷歌Gemini最“小”的一次迭代,姚順宇為何高呼“不可阻擋”?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1