首頁正文

Qwen3-Omni系列模型攬32項開源最佳表現(xiàn)

2025-09-24 16:46:40: 來源：中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報　作者：張偉
分享到：

9月24日，2025年云棲大會開幕，阿里巴巴發(fā)布通義全模態(tài)預(yù)訓(xùn)練大模型Qwen3-Omni系列模型。通過引入多種架構(gòu)升級和技術(shù)迭代，Qwen3-Omni系列的模型表現(xiàn)和效率大幅提升。在36個音視頻基準測試中，22項達到SOTA水平，其中32項取得開源模型最佳效果。語音識別、音頻理解與語音對話能力可比肩Gemini 2.5-Pro。

作為全模態(tài)模型，Qwen3-Omni能夠?qū)崿F(xiàn)全模態(tài)輸入和全模態(tài)輸出。類似于人類嬰兒一出生就全方位感知世界，Qwen3-Omni一開始就加入了“聽”“說”“寫”多模態(tài)混合訓(xùn)練。在預(yù)訓(xùn)練過程中，Qwen3-Omni采用了混合單模態(tài)和跨模態(tài)數(shù)據(jù)。此前，模型在混合訓(xùn)練后，各個功能會相互掣肘甚至降智，比如音頻理解能力提升，文字理解能力反而降低了。但Qwen3-Omni在實現(xiàn)強勁音頻與音視頻能力的同時，單模態(tài)文本與圖像性能均保持穩(wěn)定，這是業(yè)內(nèi)首次實現(xiàn)這一訓(xùn)練效果。

Qwen3-Omni的優(yōu)異表現(xiàn)源于多種架構(gòu)升級。Qwen2.5-Omni采用了雙核架構(gòu)Thinker-Talker，讓大模型擁有了人類的“大腦”和“發(fā)聲器”。Qwen3-Omni的Thinker-Talker架構(gòu)進一步加強，結(jié)合AuT預(yù)訓(xùn)練構(gòu)建強通用表征，配合多碼本設(shè)計，響應(yīng)延遲壓縮至最低。相較于半年前推出的Qwen2.5-Omni，Qwen3-Omni的交互速度更快，純模型端到端音頻對話延遲低至211ms，視頻對話延遲低至507ms；支持的語言更多，包括19種語言音頻輸入、10種語言輸出。

作為一款“會說話”的模型，Qwen3-Omni應(yīng)用場景廣泛，未來可部署于車載、智能眼鏡和手機等。用戶還可設(shè)定個性化角色、調(diào)整對話風(fēng)格，打造專屬的個人IP。相較于傳統(tǒng)的錄音轉(zhuǎn)文字軟件，Qwen3-Omni能夠處理長達30分鐘的音頻文件，無需切割音頻，即可精準識別語音、深度理解內(nèi)容。

目前，Qwen3-Omni系列已開源三款模型：Qwen3-Omni-30B-A3B-Instruct、Qwen3-Omni-30B-A3B-Thinking 和Qwen3-Omni-30B-A3B-Captioner，值得關(guān)注的是，擅長音頻描述的模型Qwen3-Omni-30B-A3B-Captioner為全球首次開源的通用音頻caption模型，可以清晰描述用戶輸入音頻的特征，填補了開源社區(qū)空白。

Qwen3-Omni現(xiàn)已在Hugging Face和ModelScope上開放，用戶可訪問Qwen Chat免費體驗Qwen3-Omni-Flash。

編輯：韓夢晨

相關(guān)閱讀：

版權(quán)與免責(zé)聲明:
①凡本站注明稿件來源為：中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報、中國高新網(wǎng)、中高新傳媒的所有文字、圖片和音視頻稿件，版權(quán)均屬本網(wǎng)所有，任何媒體、網(wǎng)站或個人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)表。已經(jīng)本網(wǎng)授權(quán)使用作品的，被授權(quán)人應(yīng)在授權(quán)范圍內(nèi)使用，并注明“來源：中國高新網(wǎng)、中高新傳媒或者中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報”。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
② 任何單位或個人認為本網(wǎng)站或本網(wǎng)站鏈接內(nèi)容可能涉嫌侵犯其合法權(quán)益，應(yīng)該及時向本網(wǎng)站書面反饋，并提供身份證明，權(quán)屬證明及詳細侵權(quán)情況證明，本網(wǎng)站在收到上述文件后，將會盡快移除被控侵權(quán)的內(nèi)容或鏈接。
③如因作品內(nèi)容、版權(quán)和其他問題需要與本網(wǎng)聯(lián)系的，請在該事由發(fā)生之日起30日內(nèi)進行。電話：010-68667266 電子郵件：dbrmt#chih.org　(請將“#”換為“@”)

曰本a级毛片无卡免费视频va,偷窥国产亚洲女爱视频在线,黄色网站一级小妹,日韩无在线视频免费连接,18以上免费视频在线观看,日本a级视频在线播放,亚洲免费人体视频美女