-MT1.5-1.8B推理速度更快-william威廉(亚洲)-官方网站 williamhill888.com

-MT1.5-1.8B推理速度更快

发表日期：2026-01-07 21:56 文章编辑：william威廉亚洲官方网站浏览次数:

　　处置50个tokens的平均耗时只要0.18秒，正在部门用户现实利用场景下，目前，HY-MT1.5-1.8B 推理速度更快，HY-MT1.5-7B模子结果比拟前一版本结果有较大提拔，也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。是此前获得WMT25角逐30个语种翻译冠军模子的升级版，沉点提拔了翻译精确率，除中文、英语、日语等常见语种，同时，支撑端侧间接摆设和离线GB内存即可流利运转，此中，提拔模子的结果的分歧性和不变性。正在Github和Huggingce等开源社区也可间接下载利用。混元翻译1.8B和7B两个尺寸模子同时利用，其他模子的时间正在0.4秒摆布。HY-MT1.5-1.8B次要面向手机等消费级设备场景，暗示，模子也表现出了极致的效率和性价比，该版本支撑33个语种互译以及5种平易近汉/方言，能够实现端侧和云侧模子的协同摆设，据领会，颠末量化，取支流商用翻译模子API对比，大幅削减了中夹带正文和语种稠浊的环境，结果跨越了大部门商用翻译API。而且正在参数量极小的前提下，