DoNews1月22日消息,今天,在百度文心Moment大會現(xiàn)場,文心大模型5.0正式版上線。

文心大模型5.0正式版參數(shù)達(dá)2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備全模態(tài)理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。

在40余項權(quán)威基準(zhǔn)的綜合評測中,文心5.0正式版的語言與多模態(tài)理解能力穩(wěn)居國際第一梯隊。圖像與視頻生成能力與垂直領(lǐng)域?qū)>P拖喈?dāng),整體處于全球領(lǐng)先水平。
目前,用戶可在文心APP、文心一言官網(wǎng)體驗,企業(yè)與開發(fā)者可通過百度千帆平臺進(jìn)行調(diào)用。
原生全模態(tài)大模型 文心5.0正式版上線
百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜介紹,與業(yè)界多數(shù)采用“后期融合”的多模態(tài)方案不同,文心5.0的技術(shù)路線采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,將文本、圖像、視頻、音頻等多源數(shù)據(jù)在同一模型框架中進(jìn)行聯(lián)合訓(xùn)練,使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,實現(xiàn)原生的全模態(tài)統(tǒng)一理解與生成。

此外,文心5.0采用超大規(guī)?;旌蠈<医Y(jié)構(gòu),具備超稀疏激活參數(shù),激活參數(shù)比低于 3%,在保持模型強大能力的同時,有效提升推理效率。
同時,基于大規(guī)模工具環(huán)境,合成長程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動鏈的端到端多輪強化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
得益于原生全模態(tài)建模,文心5.0在多模理解、代碼、創(chuàng)意寫作等能力上實現(xiàn)顯著突破。
跑得穩(wěn)、答得對、用得起 文心應(yīng)用模型深入千行百業(yè)
百度應(yīng)用模型研發(fā)部負(fù)責(zé)人賈磊分享了文心應(yīng)用模型的最新進(jìn)展。他指出,應(yīng)用模型的價值不在模型里,而在應(yīng)用里,希望讓模型在真實應(yīng)用場景里“跑得穩(wěn)、答得對、用得起”。
基于文心基礎(chǔ)大模型,百度構(gòu)建了矩陣模型和專精模型。矩陣模型面向產(chǎn)品級應(yīng)用和通用場景快速落地,包括文心Lite模型、視頻大模型和語音大模型;專精模型面向行業(yè)應(yīng)用和垂直場景,包括搜索閃電專精模型、電商蒸汽機模型、文心數(shù)字人大模型及行業(yè)大模型。

賈磊現(xiàn)場分享了三項技術(shù)突破:基于聲音 Token 的端到端合成大模型、5分鐘超越真人的直播技術(shù)、實時交互數(shù)字人技術(shù)。
其中,實時交互數(shù)字人技術(shù)采用三態(tài)Token聯(lián)動架構(gòu),實現(xiàn)文本、語音、視頻的流式控制,突破傳統(tǒng)數(shù)字人三個模態(tài)串聯(lián)的制作模式。在此基礎(chǔ)上,系統(tǒng)自動完成動作銜接、動作編排與狀態(tài)重組,并由聲音Token實時驅(qū)動表情與口型,輸出三態(tài)合一的視頻流,具有低延遲、低成本和高表現(xiàn)力的特點,百度羅永浩數(shù)字人即是基于這項技術(shù)開發(fā)。
文心5.0正式版上線百度千帆平臺
會上,百度千帆平臺產(chǎn)品負(fù)責(zé)人張婷介紹,百度千帆平臺已支持企業(yè)用戶和開發(fā)者便捷調(diào)用文心5.0正式版。

百度千帆Agent Infra提供了模型、工具、Agent開發(fā)、數(shù)據(jù)及Agent運行環(huán)境等五個層面的能力,幫助企業(yè)和開發(fā)者低門檻打造好用的Agent。
模型層面|百度千帆提供包括文心5.0正式版在內(nèi)的全場景150+SOTA模型服務(wù)。同時針對Agent場景,提供精準(zhǔn)的思維鏈控制等大模型增強服務(wù)。
工具服務(wù)|百度千帆將百度沉淀多年的成熟AI能力,如百度AI搜索、百度地圖、百度文庫、百度網(wǎng)盤等通過MCP協(xié)議開放,并引入覆蓋出行、支付等企業(yè)級高頻需求的優(yōu)質(zhì)第三方MCP能力。
Agent開發(fā)服務(wù)|千帆凝聚百度工程師實際項目經(jīng)驗,開放企業(yè)級深度研究Agent(Deep Research)等多款官方應(yīng)用。
數(shù)據(jù)服務(wù)|通過百度千帆數(shù)據(jù)智能平臺,企業(yè)可將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為模型可理解的信息。通過多模態(tài)數(shù)據(jù)統(tǒng)一管理及算力混合調(diào)度,數(shù)據(jù)處理提效達(dá)6倍,計算降本30%。
Agent運行環(huán)境|此外,千帆提供了完善的資源部署、權(quán)限管理及高可用監(jiān)控工具鏈,確保智能體在業(yè)務(wù)場景中穩(wěn)定運行。

目前,千帆平臺上已累計開發(fā)超130萬個Agents。