信容指標(biāo)揭開參數(shù)量之外的模型真本領(lǐng)

2025-12-11 20:28:01: 來源：科技日?qǐng)?bào)　作者：馬愛平
分享到：

隨著大模型技術(shù)的爆發(fā)和快速發(fā)展，各種參數(shù)、系列的模型層出不窮。它們之間有差異嗎？不同的大模型是否有各自的“天賦”？

近日，中國電信人工智能研究院（TeleAI）科研團(tuán)隊(duì)在5個(gè)開源異構(gòu)數(shù)據(jù)集上對(duì)近50個(gè)主流開源大模型測(cè)試了文本無損編碼壓縮增益，并統(tǒng)計(jì)實(shí)驗(yàn)中模型推理的計(jì)算開銷。結(jié)果顯示，不同系列模型要實(shí)現(xiàn)同等文本無損編碼壓縮增益，所需計(jì)算開銷有明顯差異。而同一系列模型，盡管尺寸各異，但文本無損編碼壓縮增益與計(jì)算開銷的比值（即大模型的信容）往往保持高度一致。

信容是信息與模型參數(shù)量的比值，用于表示模型內(nèi)存儲(chǔ)的知識(shí)密度。如果把模型比作海綿，信息比作水，那么信容就如同海綿的吸水效率，水吸得越多、越快，說明模型越“聰明”。信容為比較不同架構(gòu)和參數(shù)大模型的推理效率提供了量化依據(jù)，可用于高效評(píng)估不同預(yù)訓(xùn)練數(shù)據(jù)、模型架構(gòu)和超參數(shù)的優(yōu)劣?；谛湃菰u(píng)估指標(biāo)，通過對(duì)同源小尺寸模型的測(cè)試，就能預(yù)測(cè)大尺寸模型的性能表現(xiàn)，從而加速模型的開發(fā)和迭代。

科研團(tuán)隊(duì)以智傳網(wǎng)理論框架為基礎(chǔ)，通過“信容評(píng)估指標(biāo)”對(duì)大模型的效率進(jìn)行標(biāo)準(zhǔn)化度量。該指標(biāo)基于“壓縮即智能”的深刻洞察，結(jié)合壓縮性能與推理復(fù)雜度來定量評(píng)估模型效率，不僅能揭示模型在單位計(jì)算代價(jià)下產(chǎn)出的智能密度，還能在復(fù)雜的通算融合網(wǎng)絡(luò)中為“算”與“傳”的資源最優(yōu)配置提供理論依據(jù)。

隨著大模型推理負(fù)載消耗越來越多的計(jì)算資源和能源，如何準(zhǔn)確評(píng)估大模型的推理效率吸引了學(xué)界越來越多的關(guān)注。專家表示，科研團(tuán)隊(duì)通過信容指標(biāo)讓跨架構(gòu)和尺寸的大模型效率評(píng)估成為可能，并能有效指導(dǎo)模型的預(yù)訓(xùn)練和高效部署。這項(xiàng)研究不僅為大模型的綠色低碳發(fā)展提供了定量標(biāo)尺，也為未來通算融合網(wǎng)絡(luò)的設(shè)計(jì)指明了方向。隨著邊緣智能的快速發(fā)展，智傳網(wǎng)的“端-邊-云”分層網(wǎng)絡(luò)將在不遠(yuǎn)的未來取代傳統(tǒng)的以云上服務(wù)器為中心的計(jì)算范式，實(shí)現(xiàn)更精準(zhǔn)的模型選型與算力分配。

目前，該研究的相關(guān)代碼與數(shù)據(jù)已在相關(guān)平臺(tái)開源。

（受訪者供圖）

編輯：韓夢(mèng)晨

相關(guān)閱讀：

版權(quán)與免責(zé)聲明:
①凡本站注明稿件來源為：中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)、中國高新網(wǎng)、中高新傳媒的所有文字、圖片和音視頻稿件，版權(quán)均屬本網(wǎng)所有，任何媒體、網(wǎng)站或個(gè)人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)表。已經(jīng)本網(wǎng)授權(quán)使用作品的，被授權(quán)人應(yīng)在授權(quán)范圍內(nèi)使用，并注明“來源：中國高新網(wǎng)、中高新傳媒或者中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)”。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
② 任何單位或個(gè)人認(rèn)為本網(wǎng)站或本網(wǎng)站鏈接內(nèi)容可能涉嫌侵犯其合法權(quán)益，應(yīng)該及時(shí)向本網(wǎng)站書面反饋，并提供身份證明，權(quán)屬證明及詳細(xì)侵權(quán)情況證明，本網(wǎng)站在收到上述文件后，將會(huì)盡快移除被控侵權(quán)的內(nèi)容或鏈接。
③如因作品內(nèi)容、版權(quán)和其他問題需要與本網(wǎng)聯(lián)系的，請(qǐng)?jiān)谠撌掠砂l(fā)生之日起30日內(nèi)進(jìn)行。電話：010-68667266 電子郵件：dbrmt#chih.org　(請(qǐng)將“#”換為“@”)

曰本a级毛片无卡免费视频va,偷窥国产亚洲女爱视频在线,黄色网站一级小妹,日韩无在线视频免费连接,18以上免费视频在线观看,日本a级视频在线播放,亚洲免费人体视频美女