圆桌论坛一:人机结合大时代下的翻译公司发展
人工智能时代口译技术应用研究
王华树 | 国内首部聚焦口译技术应用和教学的著作
新书推荐
口笔译教育与评价国际论坛 二号公告
在厦门大学百年校庆之际,邀您齐聚厦门、共襄盛举
论坛推荐
2019第三届中国国际翻译高峰论坛
观看大会直播盛况
上午的圆桌论坛:人机结合大时代下的翻译公司发展
(从左到右依次为:刘海明、王斌、张龙哺、吕国、崔腾原、李强、田惠才)
吕国博士:大家都知道,现在很多翻译都开始了人机结合,人机结合大时代下,出现了很多现象。今天在现场所有语言服务行业的同仁中,环宇爱译翻译公司的董事长张龙哺先生在中国是研究机器翻译最早的专家,他到国外也参与过很多相关工作。我们现在有请张总给大家介绍一下就是他所认为的机器翻译大的趋势和脉络,过去怎么样,现在又面临什么样的突破口,我们请张龙哺张总做发言。
环宇爱译(北京)信息技术有限公司董事长 张龙哺 先生发言分享
张龙哺:谢谢大家,根据我之前所做的工作或者了解的情况先说说我自己的一些理解吧。机器翻译就是MT,这是很早了,上世纪五六十年代就有了。那个时候电脑也是刚刚开始,那时候有些台湾的、新加坡,还有美国的公司做的机器翻译。那个时候都是基于语法的,那时候效果是很差的,到八几年以后,我就用MT的软件做过一些专利翻译,翻译一遍以后再去做校对。那时候还要把东西扫描,还要把原文做校对,再去翻译,翻译完了以后再去编辑。因为专利本身有很多重复的,通过后编译的效果最好提高10%左右,那时候是八几年。后来机器翻译都是基于规则的,或者是基于统计的,基于统计的好一点,编译以后效率会提高一点。现在的趋势是人工智能神经网络发展很快,大家也看到了机器翻译的效果阅读率已经达到很高了,甚至在某些领域达到90%几了,这时候编译的工作效率就大大提高了,所以大家感觉到机器翻译对我们这个行业冲击很大。
再过十年以后,可能很多要被机器翻译来取代,这确实是一个大趋势,大家必须要结合这一点。但是并不是所有人都会被替代,这个行业的人可以做什么?可以做PE,另外某些行业是取代不了的,比如文学翻译、专利翻译等等,价格不断上升。另外随着国家“一带一路”走出去,很多小语种机器翻译是做的很不好的,这里还有很大的机会。我们要认识到机器翻译的发展,也要掌握它、了解它、应用它,找到自己今后发展的方向。
我再补充两句,要做一个基于神经网络的系统,但是仅仅这一点还是不够的,必须要跟CAT结合起来,因为在生产过程当中必须通过CAT来调用这个系统。同时新做的要存到系统里,所以一定要和CAT结合起来。结合起来的话,你就把每天翻译的东西如何调到新的系统里,所以这也是一个技术问题,也是一个商业问题。另外,你导进去了,是简单的记忆,还是基于神经网络有那种功能能够智能化的应用,这是另外一个层次的问题了,所以有三个层次的问题。
吕国博士:感谢张总的精彩发言。咱们就讲实际的,在台上的这几位专家都有自己的公司,你自己的公司在用什么样比较重要的计算机辅助软件,你们公司又如何应对机器翻译的,这些问题请嘉宾可以选择性地来回答,首先请王总做分享。
微语翻译公司CEO 王斌 先生发言分享
王斌:大家好,很多人都认为机器翻译都是翻译简单的东西,人处理的都是难的东西,在实践应用当中恰恰相反。我们和刘总有很多合作,拿一个项目来说,人民币大概是30万人民币,仅仅是字幕的翻译。人不仅能够翻译,而且要把字幕调出来看才能真正了解角色在说什么,而不仅仅是字面的意思。所以我们不要认为很简单的东西就在用机器翻译,而很难的东西不再用机器翻译,这是错误的!
我们现在发现越是专业的东西,像医学的,通信的,极其难的,我发现通过机器翻译的时候反而容易一点。而往往文学方面的,而且我们认为是机器翻译可以处理方面的东西,恰恰是机器翻译难以逾越的,所以大家要注意这个问题。不要把机器翻译简单化,完全和大家想象的不一样。另外一点,我们每个公司、每个人,只要是从业者,千万要拥抱机器翻译,事实上我们也从来没有离开过机器翻译。无论你是否喜欢还是讨厌,机器翻译一路会奔,而且是一路狂奔,就是它发展的速度和它进步的速度超过我们每个人的想象。
上海艺果信息咨询有限公司总经理 田惠才 先生发言分享
田惠才:说到CT或者MT,这一块有很多我想说的。在多年前CT技术还没有大规模普及的时候,我们就已经开始在用了,而且从中学到了很多,获得了很多。随着后面技术的发展,MT已经上来,而且达到了很好的水平,尤其是谷歌或者是搜狗,包括小牛翻译,甚至云译,它在某些垂直领域的水平已经远远超过了MTI毕业生,或者是刚刚做了两三年的专职译者,他们的翻译水平已经达不到机器翻译的水平了,这种情况下你为什么不用呢。所以有些人总是担心它会替代我们,那么你在它的肩膀上做一些其他事情不是更好吗?
在我们这次艺果杯大赛的时候,我们已经给所有的项目经理,只要是参加大赛或者参加集训营参加培训的所有的项目经理,我要让他们养成一种意识,不要说译者倒逼着你用搜狗和谷歌,一开始我们就用MT+PE。但是对于MT+PE的模式,这个还在不断探讨过当中,有没有规律可寻,有没有更好的办法解决现实机器翻译当中所带来的问题,在实践当中才能去归纳。
但是从另外一方面来说,机器翻译一分钟不到,非常漂亮的一份译文稿件就出来了。但是碰到特别大量的时候,如果还手动去谷歌、搜狗的复制粘贴,那种情况就太low了。如果机器翻译调用,一定是API调用。无论是译马网、云译,都可以直接调用,而且价格非常便宜,谷歌好像是100万字符20美元,它是多么便宜。我们在这次测试项目当中,比赛项目当中是100万英文,相当于六七百万或者将近一千万的英文字符,如果手动用谷歌粘贴,这八天的比赛时间什么都没有干,光复制就复制不清了。但是如果利用翻译平台,无论是EK也好,还是译马网的话,调用API话就会很快,半个小时甚至十几分钟就会很顺序完成,这是技术带给我们的效率是没有人力无可比拟的。对于未来,我们每个人,尤其作为翻译公司老板,除非你不想挣钱,我就是想多花钱,那你就别用技术。
上海一者信息科技有限公司产品经理 崔腾原 先生发言分享
崔腾原:我们主要是做翻译技术的研发,说到机器翻译,我们公司目前在做CAT方面的研发,我们主要集中在在线CAT,现在主要翻译模式是TM+TM和PE。据我们所知,现在许多翻译公司还没有有意识去积累自己的语言资产。在前年的时候,在上海我们当时参加了一个会议,有一个翻译公司在竞标的时候以低于同行业的价格拿下了翻译项目,而且还赚到钱,这就是有意识积累自己的语言资产。
除了CAT,现在许多公司也发布了一些文档快翻,我们公司也是有文档快翻,包括PDF文档、PPT文档等各种格式的文档,我们都可以把文档直接翻译过来进行MT+PE的操作。包括我们公司跟其他公司合作的时候,前一段时间我们发布了一个API,集成API对外开放的API接口,就是在线CAT可以直接接API,文件解析API是CAT非常关键的部件,许多CAT厂商文件解析也是非常关键的,会投入大量成本会进行研发。如果直接接API会省掉大量重复的劳动。包括CAT平台,目前我们接入9款机器翻译引擎,包括谷歌、百度、有道、搜狗、阿里,阿里主要做的是跨境电商。
在11月份的时候,也是在上海跟阿里有过交流,他们在跨境电商机器翻译这一块的交流。上个月最新加入了一个新的机器翻译引擎,目前无论是个人译员还是翻译公司,都开始在翻译在线管理平台进行翻译的操作。因为在线翻译管理平台优势就在于它可以同步进行翻译,译员翻译完了以后,可以实时审校。在导入翻译项目的时候也可以导入多种格式,整个翻译项目是非常流畅的。作为项目负责人可以直接把译文,把翻译项目分配给多个译员、审校,就可以避免语言资产的流失。据我所知,翻译公司在进行项目分发的时候,会把翻译项目做成一个翻译包,包括翻译文件和记忆库。
吕国博士:我一直有一个问题,对有些翻译公司,比如有几十个人到一二百人的公司有这样一个特点,最近有很多人在语言行业里都提出一个概念叫做语言资产,比如这一家翻译公司已经翻译了几亿字,几十亿字,这么多的字有双语对照的,这就是一笔宝贵的财富,对个人译员无所谓,但是对一个企业来讲是一笔重大的财富。有些机构建议把这些翻译好的文件如果质量比较高,可以训练出一个细分领域的引擎,训练出的引擎质量会非常高,它可能会超过谷歌、百度这些大型的搜索引擎。这几大机器翻译都是免费的,但是对小型公司不一定以同样的方式去竞争,你可以做细分领域,把你所谓的语言资产、语料库可以做成一个适合你这个领域的翻译引擎。
我代表一大批的翻译公司问这个问题了:这些翻译公司是否应该把这些语言资产利用起来训练一个引擎。如果训练这么一个引擎需要多长时间可用,是不是能够划算,哪种情况下应该选择直接使用已经训练好的翻译引擎。
比如今天早上张总也讲了几个领域的引擎,哪些情况应该自己定制化制作。还有一种情况,有些人说如果拿到人家训练好的引擎去翻译,有些特别机密的文件有可能会泄密,在你的平台上翻译完了,后台会不会收集所有的数据,收集完了以后,可能有很多商业机密暴露了。所以对于很多翻译公司来讲会存在这些担心,是自己请其他的机器翻译公司来帮着定制化制作一些机器翻译引擎,还是利用别人免费的或者收费较低的翻译引擎,花多长时间,用多长时间,真的能给我带来利润化,是不是应该定制化制作翻译引擎,这是我代表翻译公司老板提出的问题,我不知道在座嘉宾谁能来答复。
深圳云译科技有限公司语言测试经理 刘海明 先生发言分享
刘海明:给大家简单介绍一下,因为现在最新的机器翻译引擎是基于神经网络的,它是需要一个数据量的,如果是比较理想的情况下,它训练大概是需要一千万句。
我们有另外一个方法,先拿一个基础引擎,然后拿一个基础的语料往里面补,做一个增量悬链,也是百万句级的。如果一句话是十个字的话,如果有一千万字的语料就可以训练一个相对可用的引擎。
刚才我们也算了,谷歌的引擎是免费的,但是真正通过API就是收费的,每百万字符受大约20美元。谷歌主要是以英文翻中文为主,一个A就算一个字符,所以一百万字符可能真正要算成单词的话也就是十万单词左右,十个单词一句话的话,它的成本最后算下来是千字不是20美元,万字是20美元左右。谷歌不是没有成本。包括免费适用垂直领域的,我们确实无法解决安全性的问题,如果是安全,因为我们有些军工类的企业只能选择定制引擎,因为所有文件是不许上互联网的,在自己内部有非常严格的保密要求,所以它不能使用任何的在线机器翻译引擎。如果我们业务没有这么强的安全性要求的话,自己做一个取舍,到底后台能够有多安全,包括谷歌的安全程度,百度的安全程度,保证各家承诺都会自己非常安全,我只是说在现在使用过程当中真正安全的就是离线部署,它有严格的要求。客观的说,我们也要评估一下翻译这篇文章的风险性,如果客户从互联网把这篇文章发给你,这时候已经存在风险了。
王斌:关于语料库的收集,像中国语通公司曾经要花很多钱,因为我们是多语种,现在不仅是国外,包括中国对多语种的语料缺乏程度非常大,因为我们做的是中文的,所以他们要买我们的东西。最后我们发现这些东西被他们用的话是绝对会泄密的,而且他们要进行分析,他们要进行处理,而且我们这些东西都是跟大的公司有保密协议,有些保密程度一个项目还要再签一次确认,做完以后所有人都要签字,把所有文档都要销毁。虽然它可以花很大的钱,很多人想买我们的语料,但是我们不能卖,也不可能卖。云译语料这件事在这个行业内一直是大家有比较大的分歧,语料到底是属于谁的,有的译员认为是属于我的,有的人认为是属于客户,因为客户给你钱的时候他有这个要求,还有人认为是翻译公司的,这件事目前还没有定论,它是有一定风险的,所以不卖是对的。
阳光创译生产中心总监 李强 先生发言分享
李强:2004年我刚毕业的时候就是机器翻译,按照这个年头来说算是很老的同志,但是我们之前已经做的比较成熟了。比如我们做的机器翻译,我们也开发了很多版本,我们主要是做英译中的。没有通过定制的机器翻译系统大概是70%,经过定制之后做一些抽词,抽词是一方面,另外是多词表达。机器翻译为什么被淘汰?当时国内是两家公司做机器翻译,一个是赛迪翻译,一个是华电翻译,出产品的是华电,还有厦大、哈工大这几个大学也在做机器翻译,还有刘群做机器翻译,当时刘群是国内最早做统计翻译的。当时机器翻译被淘汰我分析有两个原因,第一它是一个软件,这个软件普及性不是很高,第二是都是专业用户,另外机器翻译难度特别大,它提高1%的话就非常困难,限制了它增长的使用。然后谷歌出现了。
CAT的核心就是翻译系统,我还专门问了一下CAT的提高工作效率,我问了一些同事,CAT如果没有辞典的记忆库,翻译大概是20%左右,如果有几百万的语料库,翻译大概到40%到50%,这么来看的话效率是很高的。用这个系统的话,用三年收入可以提高50%,这个已经是非常可观的,这是CAT的应用,核心就是一个翻译记忆库,一个辞典,你使其他收费工具很快容易上手。
还有机器翻译对笔译影响和口译的影响,机器翻译对笔译影响一直很大。机器翻译有一个好处,它还有一个译前处理,这个是谷歌做不了的,一般来说机器翻译要比新的译员翻译的好。但是机器对口译商用市场影响比较小,分三种:一个是商务洽谈,还有一个是医院,另外一个是法庭或者是公安局询问,这几个地方都是不能出差错的地方,一句话都不能错,不能用机器翻译,所以要有严谨性。另外是口译有及时性和交互性,口译的特点限制了机器翻译的使用。还有出国旅游签证还带着翻译去,会做其他相关的工作,与当地各种人事务打交道,而不简单是一个翻译,所以翻译机也好,还包括机器翻译,对口译影响是比较小的。 另外MTI的学生,笔译、口译该怎么学还得怎么学,你能够做一个好的译员才能做PE。
吕国博士:我还有一个问题,我记得一年多、两年前,小E翻译机刚刚出来的时候,那时候在社会非常震惊,说这么厉害,但是真也罢,假也罢,小E翻译机当时大卖特卖,再后来前几天我们去到京东查了一下,光翻译机有200多款,而且有些人说达到几十亿、几百亿的市场在接下来两三年迅速地发展起来。即便我翻译,我在两个月前,也就是2018年11月份,我在哥斯达黎加的时候,不讲英语,也说小语种,我也搞不清楚,手机上一些翻译软件也起到了作用,至少我吃饭、买物品还真起到了一些作用。翻译机市场究竟趋势如何,它取代了我们的哪些工作,你怎么看翻译机目前的发展,对这个问题哪个嘉宾可以做一点分享。
刘海明:我觉得他有一个特别好的应用场景,对质量要求不好的应用场景,在什么时候最好呢?就是女婿给老丈母娘和老丈爷送礼物,刚退休,身体特别好,没事的时候出去玩儿,买这个礼物很好,确实可以起到很大的作用。但是做不到准确的翻译。我们现在在做机器同传尝试,有点作弊的方法,但是真的需要几百场、几千场不断去验证,包括语言识别,现在不能保证机器代替同传,但是可以提供字幕的形式。当字幕越来越准或者足够准的时候,可以给现场的听众提供一种辅助。在特定人群有一些需求,但是又无法明显界定和手机APP的区别,因为手机APP也是翻译机的一种变形,未来同传还是有一定市场的。
阳光创译董事长 吕国 博士作出总结
吕国博士:我们圆桌论坛主题是人机结合大时代下的翻译公司的发展。由于时间的关系,最后每个嘉宾给咱们所有参会者用一句话给大家提一个建议或者是忠告。
王斌:我觉得机器翻译在一定程度上真的可以解放我们的大脑和解放我们的双手,机器翻译前途无量。
刘海明:技术本身永远都不以人的态度为转移,它该发展就发展,它如果遇到瓶颈就陷入困境,所以一句话的总结:我们要以开放的心态来拥抱机器翻译。
张龙哺:大家要拥抱机器翻译,机器翻译会带来翻译行业的重大变革,大家要适应这个趋势。同时机器翻译会改变一切人的生活模式,同时会创造更多新的翻译需求,因为价格便宜,所以需求量会扩大,所以这个行业还是美好的,很有前景的。
崔腾原:希望各位公司的老板和各位老师要积累好自己的语言资产,拥抱我们的机器翻译,以一个开放的心态来对待我们即将要面临的云平台,因为云平台也许就是我们未来翻译的发展趋势。
李强:对于机器翻译,我一直是支持的!
田惠才:2019年,我们要积极地去拥抱技术,没有睡醒的人赶紧醒来吧,谢谢大家!
吕国博士:这是最好的时代,这也是最坏的时代,我们所能做的就是拥抱人机结合,拥抱机器翻译,把我们的翻译行业做大做强。谢谢!
原文摘自:矿业能源翻译实践与研究
相关推荐
★★★★★ 5/5