【jinnianhui.com科技消息】12月30日,騰訊官方宣布開源其混元翻譯模型1.5版本,包含Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B兩款模型,支持33種國際語言互譯及5種民漢/方言翻譯,覆蓋捷克語、馬拉地語、愛沙尼亞語、冰島語等小語種。兩個(gè)模型已在騰訊混元官網(wǎng)、GitHub及HuggingFace平臺(tái)上線,供開發(fā)者免費(fèi)下載使用。

其中,HY-MT1.5-1.8B專為手機(jī)等消費(fèi)級(jí)設(shè)備優(yōu)化,經(jīng)量化后僅需1GB內(nèi)存即可實(shí)現(xiàn)端側(cè)離線實(shí)時(shí)翻譯,在參數(shù)量極小的情況下,翻譯效果已超過多數(shù)主流商用翻譯API。實(shí)測顯示,該模型處理50個(gè)tokens平均耗時(shí)僅0.18秒,顯著快于其他商用模型約0.4秒的響應(yīng)時(shí)間。在FLORES-200、WMT25及民漢翻譯測試集中,其表現(xiàn)達(dá)到Gemini-3.0-Pro閉源模型90%的水平,部分場景下差距微小,遠(yuǎn)超同類開源與商用方案。

HY-MT1.5-7B則為此前WMT25比賽30項(xiàng)冠軍模型的升級(jí)版,重點(diǎn)提升翻譯準(zhǔn)確率,有效減少譯文夾帶注釋或語種混雜問題。兩款模型可協(xié)同部署,實(shí)現(xiàn)端云結(jié)合,提升整體翻譯一致性與穩(wěn)定性。

實(shí)用性方面,新模型支持術(shù)語庫自定義、上下文長文本理解及帶格式文本翻譯。用戶可導(dǎo)入醫(yī)學(xué)、法律、金融等行業(yè)術(shù)語表,確保專業(yè)詞匯準(zhǔn)確;模型還能基于前文語境優(yōu)化后續(xù)翻譯,適用于會(huì)議記錄、小說章節(jié)等長內(nèi)容;同時(shí)保留原始排版格式,提升網(wǎng)頁、文檔等結(jié)構(gòu)化內(nèi)容的翻譯可用性。

技術(shù)上,1.8B模型通過On-Policy Distillation策略,由7B大模型作為教師實(shí)時(shí)引導(dǎo)訓(xùn)練,避免死記硬背,顯著提升小模型泛化能力。目前,該系列模型已在騰訊會(huì)議、企業(yè)微信、QQ瀏覽器等內(nèi)部產(chǎn)品中落地,并兼容Arm、高通、Intel、沐曦等主流硬件平臺(tái)。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
-金年會(huì)體育