近期,国外一份调查报告误将392万和83万的采购费用翻译为39.2亿和830万,闹出国际笑话。有分析认为,此乌龙事件是国外机器翻译软件造成的。
让很多人意想不到的是,看似简单的数字,在机器翻译中向来是一大痛点。就以「392.687694万元」为例,我们测试不同翻译软件的翻译结果。
数字翻译「中译英」测试
首先测试「中译英」,国内外9款主流翻译软件中,只有火山翻译和腾讯翻译君准确地翻译出了392万。其余7款产品,有翻译成392的,有翻译成39.2亿的,甚至还有翻译成392万亿的,比正确结果扩大一亿倍,另外4款都翻译成了3.92亿。测试结果如下列组图所示。
火山翻译:
腾讯翻译君:
Moneycorp 为数字资产交易所提供流动性管理模块:金色财经报道,支付金融科技公司 Moneycorp 今天宣布为数字资产交易所 (DAX) 提供商推出其外汇流动性管理解决方案。
Moneycorp North America 首席执行官 Tejus Oza 表示,“我们今天的声明对社区来说意义重大,因为我们的 API 使他们能够集成复杂的系统和数据,同时在任何系统或工作流程中自动化和访问外汇汇率。”(finextra)[2022/8/9 12:11:15]
以下为其他7款翻译产品的测试结果。
翻译为39.2亿:
翻译为392:
腾讯安全将发行网络安全主题数字藏品:11月3日消息,2021腾讯数字生态大会将于武汉隆重开幕。行业领袖、技术领军人物、经济学者等将共同探讨数字经济发展趋势,展示产业互联网的优秀实践成果。其中,由腾讯安全主办的云安全专场、数字化业务风控专场将聚焦数字化进程下产业安全防护和安全体系建设等问题于11月4日召开,届时,腾讯安全将特别举办一场数字藏品艺术画展,联合三大美院7位青年艺术家,设计发行网络安全主题数字藏品,于线上、线下限量发放6007份,以世界名画趣解网络安全。(新世纪科技)[2021/11/3 6:28:27]
翻译为392万亿:
翻译为3.92亿:
第三届数字中国建设峰会总投资3316亿元 涵盖区块链等前沿领域:10月14日,第三届数字中国建设峰会在福州闭幕。本届峰会共签约数字经济项目426个、总投资3316亿元,涵盖了人工智能、5G、工业互联网、区块链等前沿领域,将有力推动数字产业化、产业数字化。(新华社)[2020/10/14]
数字翻译「英译中」测试
我们用不同软件把英文「3.92687694millionyuan(RMB)」翻译回中文,会是怎么样的结果?
这次只有火山翻译准确翻译出了392万元人民币。其他8款产品,有翻成3.92万的,有翻成39.2亿的,也有翻成392万亿的,另外5家都翻成了3.92万亿。测试结果见下列组图。
火山翻译:
动态 | 百度加入币圈整顿 数字货币相关贴吧被封禁:据华夏时报消息,继腾讯、阿里巴巴两大互联网巨头掐断数字货币的场外支付渠道后,百度也加入了对币圈的全面封锁,往日热闹的币圈吧、数字货币吧、虚拟货币吧等贴吧被全部封禁,就连一些名不见经转的币项目贴吧也消失得无影无踪。\"目前公司加大了对数字货币这方面的监管,并根据相关法律法规和政策,对相关贴吧暂不开放。\"百度的内部人士说。
据查证,数字货币吧和虚拟货币吧目前提示“根据相关政策,本吧暂不开放”,不过如数字币吧、加密数字货币吧等等相关的贴吧目前仍可进入。[2018/8/26]
其他产品的翻译结果:
“千人计划”特聘教授蔡维德:数字法币或要等第10代区块链技术才能实现:中央组织部“千人计划”特聘教授,英国伦敦大学学院 (UCL) 区块链研究中心科学顾问蔡维德近日在金融界的采访中表示,一般的数字代币根本达不到数字法币的要求,如果用第一代或是第二代数字代币的技术做数字法币,恐怕会遇到“不可能完成的任务”, 因为技术距离实在太远。这距离就像用脚踏车上月球一样,是不可能的。大规模数字法币可能要等第10代区块链技术出来才能实现。[2018/3/23]
数字的重要性毋庸多言,在商业条款中如果翻译错一个数字,可能会带来成千上万的损失;建筑图纸中一个数字翻译的疏漏,就可能导致一项庞大建筑工程轰然倒塌。想要保证数字翻译的准确度,远不是誊写一串阿拉伯数字再翻译单位这么简单。从上面测试中也可以看到,一些国际巨头的翻译产品,在数字翻译中照样会出现偏差万倍甚至上亿倍的错误。
数字翻译难在哪?
数字翻译对翻译者关于目标语言数字表达的理解要求较高,在中英翻译中,数字翻译的难点主要在以下方面:
a.中英语言中不同的数字单位,如1000万翻译成10million,不能简单地「拷贝」
b.很长的数字容易带来偏差
c.超大数字的翻译问题,如trillion、万亿以上的单位
d.中英语言中不同的计量单位,如中文中的“斤”,容易被翻译成“kg”
e.带有货币符号的数字容易犯错
当前,很多翻译软件对数字没有做额外的处理,采用的是与普通文字相同的sequence-to-sequence神经机器翻译模型。这一模型翻译质量较高,流畅性较好,但存在一个显著的缺陷,就是缺乏常识和推理能力,无法理解对于人类来说比较简单的规则,例如,“万”和“million”的的转换、单位货币之间的不同等。
火山翻译如何解决数字翻译难题?
我们从火山翻译技术分享中了解到,火山翻译的翻译模型见到对应的数字之后,会将其抽取出来,通过推理、计算等智能过程,对数字进行跨语言的语义转换,然后将其置于翻译句子适当的位置中,类似人类的翻译推理过程。
火山翻译是字节跳动旗下火山引擎的AI中台能力之一,技术能力已经在飞书的文档、消息翻译和火山引擎的企业级客户中广泛应用。由于当前机器翻译场景中存在大量的数字内容,数字翻译也一直是火山翻译团队持续优化的重要方向。目前,火山翻译已经支持56门语言、3080个语向的翻译。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。