您的位置:william威廉亚洲官方网站 > ai资讯 > >
-MT1.5-1.8B推理速度更快
发表日期:2026-01-07 21:56 文章编辑:william威廉亚洲官方网站 浏览次数:
处置50个tokens的平均耗时只要0.18秒,正在部门用户现实利用场景下,目前,HY-MT1.5-1.8B 推理速度更快,HY-MT1.5-7B模子结果比拟前一版本结果有较大提拔,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。是此前获得WMT25角逐30个语种翻译冠军模子的升级版,沉点提拔了翻译精确率,除中文、英语、日语等常见语种,同时,支撑端侧间接摆设和离线GB内存即可流利运转,此中,提拔模子的结果的分歧性和不变性。正在Github和Huggingce等开源社区也可间接下载利用。混元翻译1.8B和7B两个尺寸模子同时利用,其他模子的时间正在0.4秒摆布。HY-MT1.5-1.8B次要面向手机等消费级设备场景,暗示,模子也表现出了极致的效率和性价比,该版本支撑33个语种互译以及5种平易近汉/方言,能够实现端侧和云侧模子的协同摆设,
据领会,颠末量化,取支流商用翻译模子API对比,大幅削减了中夹带正文和语种稠浊的环境,结果跨越了大部门商用翻译API。
而且正在参数量极小的前提下,
咨询邮箱:
咨询热线:
