媒体聚焦 来源:钛媒体日期:2017-12-28浏览次数:3996
国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation,简称IWSLT)是国际上最具影响力的口语机器翻译评测比赛,每年举办一次,至今已经举办了14 届。
在今年12月15号结束的2017 年IWSLT 大赛中,首次参赛的一家中国公司——中译语通科技股份有限公司(以下简称中译语通),取得了16 个语言方向平均分第一名的成绩。而此前,科大讯飞曾经在2014 年获得中英和英中两个语言方向第一。
赛后接受媒体采访时,中译语通CEO于洋说:“我们的技术能力是领先的、更是全面的。在跨语言及多语言翻译层面,大赛比拼了在限定数据范围内英、德、意、荷、罗马尼亚五个语种,共20 个语言方向互译。同时还比较了在缺少德语与荷兰语以及意大利语与罗马尼亚语双语平行语料的情况下翻译引擎对该四个语言方向解码的效果。在除去没有平行双语语料的其他16个语言方向中,我们取得了平均分第一名的好成绩,并且这个成绩甚至超过了使用全部20个语言方向的小数据集和更大数据集的所有参赛队伍在该16 个语言方向的平均得分。”
2017 年IWSLT 大赛吸引了世界各地多所机器翻译领域的知名大学及研究所参加,包括英国爱丁堡大学(University of Edinburgh)、意大利Bruno Kessler 基金会(FBK)、德国卡尔斯鲁厄理工学院(KIT)、日本京都大学(Kyoto University)、德国莱茵-威斯特法伦理工大学(RWTH)、萨尔大学以及德国人工智能德国研究中心(UDSDFK)等。
本次比赛的训练集和评测集都是主办方提供的,所有参赛团队在相同的数据基础上比拼技术,同时技术难度较往年也有较大提升,打破了以往一个模型解析1 个语言对的规则,需要用一个模型解析5个语种,20个语言方向。
口语机器翻译评测结果
公开资料显示,中译语通成立于2013 年,是全球领先的大数据和人工智能企业。以“语言连接世界,数据驱动未来”为目标,中译语通自主研发了覆盖机器翻译、语音识别、图像识别、语义搜索、知识图谱、大数据分析、大数据可视化等领域的先进技术,构建起“译云”语言科技生态与“译见”大数据生态。
自2013年至2016 年三年间,中译语通在机器翻译和大数据研发方面投入很大,机器翻译研发累计投入已经超过2亿元,在大数据分析方面每年投入研发资金超过1 亿元。目前,中译语通的神经网络机器翻译已经实现了37个语种的翻译,约1332 个语言方向,建立了50 亿+句对超大规模平行语料库。其中中俄、中韩、中西、中葡等十余个语言的机器翻译已经达到世界领先水平,并且在该领域已经实现规模化的垂直领域机器翻译的场景化应用。