DoNews1月20日消息,近期,MiniMax 在港交所成功上市,其與聲網(wǎng)也進(jìn)一步深化了戰(zhàn)略合作關(guān)系。MiniMax 將領(lǐng)先的文本轉(zhuǎn)語音(TTS)技術(shù)及多模態(tài)大模型,與聲網(wǎng)對話式 AI 引擎以及全球超低延時實(shí)時傳輸網(wǎng)絡(luò)(SD-RTN)相結(jié)合。這一強(qiáng)強(qiáng)聯(lián)手將助力全球開發(fā)者與企業(yè),部署更具生命力、響應(yīng)更靈敏、體驗(yàn)更擬人化的對話式 AI 產(chǎn)品。

早在2024年10月,聲網(wǎng)就宣布與 MiniMax 聯(lián)手發(fā)布國內(nèi)首個 Realtime API,助力 AI 告別“機(jī)械感”,實(shí)現(xiàn)更低延時的自然交流。
從模型能力走向真實(shí)世界的交互
隨著生成式 AI 的飛速發(fā)展,行業(yè)真正的挑戰(zhàn)在于如何將高質(zhì)量的 AI 轉(zhuǎn)化為跨設(shè)備、跨復(fù)雜網(wǎng)絡(luò)環(huán)境的自然實(shí)時交互體驗(yàn)。

MiniMax 的 TTS 模型具備表達(dá)豐富、可控且情感細(xì)膩的語音生成能力,支持多種語言、語調(diào)和說話風(fēng)格。而聲網(wǎng)則提供了互補(bǔ)的核心優(yōu)勢:將 AI 輸出轉(zhuǎn)化為實(shí)時交互體驗(yàn),這使得 AI 的表現(xiàn)更貼近人類的溝通模式。
此次合作的獨(dú)特之處不僅在于技術(shù)層面的集成,更在于雙方全球化的視野:
MiniMax 帶來具備全球視野的前沿 AI 模型:其模型在設(shè)計(jì)之初就針對多語言、多文化及內(nèi)容豐富的應(yīng)用場景進(jìn)行了優(yōu)化。
聲網(wǎng)提供經(jīng)受過實(shí)戰(zhàn)檢驗(yàn)的全球?qū)崟r網(wǎng)絡(luò):其自建的 SD-RTN? ?網(wǎng)絡(luò)覆蓋 200 多個國家和地區(qū),旨在提供毫秒級的超低延時、優(yōu)秀的抖動控制以及大規(guī)模并發(fā)下的音視頻質(zhì)量保證。
雙方共同填補(bǔ)了 AI 生態(tài)系統(tǒng)中的關(guān)鍵空白:即無論用戶身處何地、使用何種設(shè)備,都能獲得穩(wěn)定、自然且富有表現(xiàn)力的 AI 語音交互體驗(yàn) 。
賦能下一代實(shí)時語音 AI 產(chǎn)品
聲網(wǎng)與 MiniMax 的聯(lián)合解決方案已在多個場景中落地,包括:
· AI 陪伴與智能設(shè)備:需要實(shí)時語音反饋的交互場景
· 實(shí)時語音 Agents:用于客服和企業(yè)工作流的自動化交互?
· 互動教育與內(nèi)容平臺:對自然語音質(zhì)量和全球覆蓋能力有極高要求的應(yīng)用?
· 多模態(tài) AI 應(yīng)用:語音需與視覺、情感及動作保持高度同步的復(fù)雜場景?
聲網(wǎng)與 MiniMax 為開發(fā)者提供了一個從文本生成到實(shí)時語音交付的完整、端到端對話式 AI 基礎(chǔ)底座。隨著 AI 從云端走向日常交互的每一個瞬間,雙方將持續(xù)為開發(fā)者和企業(yè)提供強(qiáng)有力的支持。
未來,雙方計(jì)劃在實(shí)時語音智能體、AI 原生設(shè)備以及多模態(tài)對話體驗(yàn)等領(lǐng)域進(jìn)一步擴(kuò)大合作。