华尔街见闻获悉,本周,由阿里国际联合上海人工智能实验室、北京语言大学一起制定的AI翻译测评榜单TransBench在OpenCompass上线。与传统的翻译测评体系相比,该榜单增加了幻觉率、文化禁忌词、敬语规范等指标,并首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,测评方法也已开源。
现代实验室装备网 实验室行业专业网络媒体
4001009187 0731-84444840
©Copyright 2000-2024 现代资讯 All Rights Reserved
QQ:369830746
4001009187 0731-84444840
©Copyright 2000-2024 现代资讯 All Rights Reserved
QQ:369830746