武汉供卵助孕
网站文章
华为陈圣权:数据是机器翻译发展的关键因素_瑞科上海翻译公司
来源:http://www.sdham.com  日期:2021-08-05
华为陈圣权:数据是机器翻译开展的关键因素_瑞科上海翻译公司

  正在《圣经》中,人类结合起来兴修愿望能通往天国的高塔;为了阻挠人类的筹划,天主让人类道分歧的语言,使人类相互之间不克不及相同,巴别塔筹划是以而终结,而巴别塔也成为语言障碍的一个代名词。
  而借助实现高效率、高质量的机器翻译,咱们却有能够攻破语言障碍,实现超过语言的无障碍交换。克日,ChinaIT.com独家专访了中国翻译协会副会长、华为翻译中间前主任陈圣权,他关于机器翻译行业的开展、使用前景等方面提出了许多独到的见解。
  人工智能技巧鞭策机器翻译快捷开展
  作为计较语言学的一个分支,机器翻译的开展依赖于人工智能技巧的演进,特殊是神经网络等技巧的呈现,让机器翻译技巧失掉了日新月异的晋升。陈圣权认为,机器翻译的先进起首表现正在服从方面,依靠于壮大的运算才能,机器翻译速率远超过人工翻译,可以做到“立等可取”;其次,机器翻译愈来愈不“翻译腔”了,知足了根本的可读性跟可用性的需要,让人类可以解脱简略、机器的翻译事情,投入到真正有创造性的翻译事情上。
  “跨国公司的外部交换、专业仿单翻译、代码正文等场景是机器翻译正在企业外部罕见的几个使用场景,其不只正在速率上远远跨越了人工翻译,并且准确率也到达了很下的程度。以华为为例,机器翻译现阶段曾经资助华为大大放慢了翻译的托付速率,勤俭了30%的人力资源本钱,借发掘了很多翻译需要。现阶段,注册华为机器翻译体系的用户到达9万多人,天天翻译的托付量到达5000万-1亿字符数。”陈圣权默示。
  “作为人工智能的典范使用场景之一,机器翻译此刻曾经绝对较为成熟,正在特定场景下,机器翻译以至可能比人工翻译的后果更好,”陈圣权默示,“跟着人工智能技巧的先进,机器翻译将会使用正在更多场景中”。
  数据成为机器翻译的焦点因素之一
  机器翻译技巧与使用比年之所以失掉了日新月异的希望,与人工智能的广泛应用是分不开的,恰是由于人工智能技巧的开展,使得机械可以解脱传统的翻译形式,从而“读懂”分歧的语言。“与人工智能开展的因素类似,现阶段机器翻译开展的因素也可以归结为以下几点:壮大的计算能力、进步前辈的算法模子、和丰硕的数据。”
  此中,陈圣权特殊提到了数据的重要性,他认为,正在现阶段的机器翻译使用理论中,计算能力并不是显著的瓶颈,并且开源社区也供给了大批进步前辈、且仍正在不休退化的机器翻译算法模子,那让机器翻译的技巧门坎大幅降低。相比力之下,数据的重要性加倍凸显,数据量的巨细跟精准水平常常决意了机器翻译引擎的后果,谷歌正在机器翻译范畴下过一个结论:数据散范围每翻一倍,它自动评估的目标便可能晋升0.5个百分点。
  特殊是正在行业化场景的机器翻译需要中,数据的掣肘便显得较着。面向"大众的机器翻译体系尚可以依附互联网上的公然数据,知足部门一样平常场景的翻译需要,可是一旦波及到专业范畴或是企业外部的翻译需要,这些数据便远远不够了。
  “因为数据保护、个人隐私、合规性等方面的思量,很少有企业会向机器翻译使用开放本人的数据,这一问题正在很长时间内皆将难以失掉办理,若是得不到这些数据的支持,机器翻译的质量将会遭到很大影响。华为的机器翻译理论也评释,正在外部文档翻译方面,自有平台正在翻译质量方面显著跨越谷歌等机器翻译平台”,陈圣权默示,“是以,正在行业使用方面,由通用型的机器翻译平台+企业自有锻炼数据+定制化才能构成的机器翻译解决方案,将会成为现阶段企业拥抱机器翻译的优先选择。”
  机器翻译的将来可期
  虽然机器翻译的使用现阶段仍局限于特定场景中,可是机器翻译的开展速率让咱们关于将来抱有十分悲观的立场。特殊是正在神经网络取代统计学派成为翻译范畴的主流研讨方式之后,机器翻译的单词错误率、辞汇毛病跟语法错误率皆大幅降低,跨越了过来几十年所取得的结果。可以预感,跟着神经网络等技巧的继承晋升,机器翻译的准确率借将进一步晋升。
  便像陈圣权所说,“除文学、艺术等比力幽美,须要施展人类创造力、融会人类感情的翻译需要以外,机器翻译将进一步替换人类翻译,知足分歧语言的相同需要。”


文章起源:ChinaIT.com


参考资料

标签: