DoNews5月21日消息,今天召開的 2025 年 I/O 開發(fā)者大會上,谷歌推出了 Gemma 3n 端側多模態(tài) AI 模型,可以在手機、平板和筆記本電腦上本地運行,處理音頻、文本、圖片和視頻多種數(shù)據(jù)類型。

Gemma 產(chǎn)品經(jīng)理 Gus Martins 透露,Gemma 3n 可以在內(nèi)存小于 2GB 的設備上運行,采用 Gemini Nano 同款架構,但性能表現(xiàn)更出色。他強調(diào):“Gemma 3n 為設備端 AI 應用帶來了驚人的表現(xiàn)力。”
Gemma 3n 的最大亮點在于采用了谷歌 DeepMind 開發(fā)的 Per-Layer Embeddings(PLE)技術,顯著降低了模型的內(nèi)存需求。盡管其參數(shù)量分別為 5B 和 8B,但內(nèi)存占用僅相當于 2B 和 4B 模型。

谷歌宣稱,Gemma 3n 的內(nèi)存占用分別低至 2GB 和 3GB。此外,通過 PLE、KVC 共享和高級激活量化等技術,Gemma 3n 在移動設備上的響應速度提升 1.5 倍,質(zhì)量也優(yōu)于 Gemma 3 4B 版本。
Gemma 3n 在非英語語言處理上也有突破,尤其在日語、德語、韓語、西班牙語和法語中表現(xiàn)優(yōu)異,在多語言基準測試 WMT24++ 中,該模型得分高達 50.1%。
用戶無需任何設置,目前可通過 Google AI Studio 直接在瀏覽器中使用 Gemma 3n;開發(fā)者則可通過 Google AI Edge 集成本地功能,支持文本和圖像理解與生成,未來還將擴展更多能力。