知兮作者|王涵编辑|冰前智喜12月30日报道,腾讯混源开源翻译模型1.5版本发布。它包括Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B两个型号,支持33种语言和5种中文/方言之间的翻译。这包括中文、英语和日语等常见语言,以及捷克语、马拉地语、爱沙尼亚语、冰岛语和其他较小的语言。 ▲腾讯-HY-MT1.5-1.8B开源(来源:抱脸) ▲腾讯-HY-MT1.5-7B开源(来源:抱脸) HY-MT1.5-1.8B主要针对手机等消费设备场景。支持直接部署到设备和离线实时翻译。只需要1GB内存即可流畅运行。 HY-MT1.5-7B型号是在WMT25比赛中获得30种语言翻译冠军的型号的升级版本。 rIt专注于提高翻译准确性,大幅减少评论和混合语言翻译中的ges,进一步提高了其实用性。在部分用户的实际使用场景中,同时使用混元翻译1.8B和7B尺寸模型,可以实现端侧和云端模型的联合部署,提高模型效果的一致性和稳定性。在基准测试方面,Tencent-HY-MT1.5-1.8B在中外翻译、Flores200英外翻译测试套件、WMT25和中文测试套件中整体表现优于Qwen3-32B,并与Qwen3-235B-A22B等较大的闭源模型不相上下。同时,在处理效率方面,与常规商业翻译模型API相比,HY-MT1.5-1.8B处理50个token的平均时间仅为0.18秒,而其他模型约为0.4秒。从技术上来说,HY-MT1.5-1.8B体积小,型号大。达到戴尔效应。通过引入 On-Policy DistillaHY-MT1.5-7B允许教师实时教授18亿个学生模型,避免记忆标准答案。通过在预测序列分布时纠正权衡,小规模模型可以从错误中学习,从而提高性能。 ▲基于策略的蒸馏策略(来源:腾讯混元) 目前,两款车型均在腾讯混元官网在线销售。也可以直接在GitHub、Hugging Face等开源社区下载使用。支持多种平台部署,包括 Arm、Qualcomm、Intel、Muxi。混源官网:https://hunyuan.tencent.com/modelSquare/home/listGitHub链接:https://github.com/Tencent-Hunyuan/HY-MTHugging Face链接:https://huggingface.co/collections/tencent/hy-mt15 1.互译性能为Qwen3-32B,常用的中外、英外翻译测试集响应时间仅为0.18秒。弗洛雷斯 200、WMT25、中文测试套件Tencent-HY-MT1.5-1.8B的表现总体优于Qwen3-32B等中型开源模型和主要商业翻译API,达到Qwen3-235B-A22B等大型闭源模型的90%水平。 ▲ Flores200、WMT25 及中文测试结果(来源:腾讯混源) 在翻译质量和响应效率方面,HY-MT1.5-1.8B 模型在 FLORES-200 的质量评估中取得了 78% 左右的成绩,但平均响应时间仅为 0.18 秒,表现优于最流行的商业翻译 API。 ▲ 评测结果FLORES-200质量(来源:腾讯混元) 2、腾讯混元的翻译模型1.5响应速度快,准确率“优秀”,从医学术语到粤语对话。腾讯混源翻译模型1.5经过优化的模型设计和推理逻辑,适用于即时通讯、智能翻译等高性能实时翻译场景。客户服务和移动翻译应用程序。首先是术语。腾讯混合翻译模型1.5具有定制术语库的能力。用户可以针对不同行业和专业场景(医疗、法律、金融、科技等)预先创建专门的术语对照表,以确保关键术语翻译的一致性和准确性。该功能有效弥补了小模型在处理专业文本时的词汇量不足,保证轻量级实现的同时,让您能够执行行业内高要求的翻译任务。用户可以通过简单的设置导入术语库,并优先选择自定义的标准术语进行翻译,使专业文档、技术手册、合同等的翻译更加可靠和值得信赖。 ▲术语翻译(来源:腾讯混元)志东老师也尝试过。我们上传了一组医学术语并询问他们将它们翻译成中文。在响应速度方面,腾讯混元翻译模型1.5的响应时间非常短,生成翻译结果的速度非常快。与原文相比,翻译准确率100%。 ▲ 术语翻译(来源:智西西实测) 为了看看腾讯的混合翻译模型1.5的方言翻译效果如何,除了英语之外,我们还上传了五个职场中经常出现的粤语对话。结果显示,腾讯混元翻译模型1.5也能准确翻译粤语单词和声调,准确度也“优秀”。 ▲粤语翻译(来源:知西西测量) 第二个是翻译语境的能力。该功能真正适合定时对话翻译、长文档翻译、多轮交互场景。混合翻译模型具有更强的能力来理解长文本和交互的上下文,并且n 翻译基于:根据之前的上下文不断优化后续翻译结果,显着提高长对话、多轮问答、连续段落等场景下的翻译连贯性和一致性。无论是翻译会议记录、访谈、小说章节还是长篇技术文档,该模型都可以有效捕获和维护上下文的逻辑关系,避免引用不清楚、语义缺陷或文体连贯问题。 ▲ 上下文翻译(来源:腾讯混元) 第三,可以按照格式进行翻译。混源的翻译模型能够遵循精确的指令,在翻译前后保持格式信息不变,使翻译结果更加准确实用。 ▲ 格式翻译(来源:腾讯混源) 为了直观地展示混源Tencent-HY-MT1.5-1.8B的翻译效果,下面是一个com与苹果手机自带的离线翻译结果对比: ▲ 与苹果翻译本身对比(来源:腾讯混源) 结论:腾讯的开源降低了翻译模型的应用门槛。此次,腾讯推出紧凑型开源翻译模型,将降低翻译模型在手机等设备上运行的门槛。腾讯的混元翻译模型不仅在国际机器翻译大赛中获得第30名,而且在首次开源一周后就登上Hugging Face模型趋势榜第一名。混合翻译模式已在腾讯内部多个业务场景落地,包括腾讯会议、企业微信、QQ浏览器、客服翻译等。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本方案平台form仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。