低资源语言的机器翻译研究探讨-张冬冬


人工智能时代口译技术应用研究
王华树 | 国内首部聚焦口译技术应用和教学的著作
新书推荐


口笔译教育与评价国际论坛 二号公告
在厦门大学百年校庆之际,邀您齐聚厦门、共襄盛举
论坛推荐

低资源语言的机器翻译研究探讨-张冬冬
play-rounded-fill

低资源语言的机器翻译研究探讨-张冬冬

《机器翻译论坛2019》
观看论坛全程直播盛况

低资源语言的机器翻译研究探讨

张冬冬
微软亚洲研究院高级研究员

机器翻译已经成为促进全球交流的重要组成部分,如何应对低资源语言机器翻译的挑战?微软亚洲研究院自然语言计算组研究员张冬冬博士介绍了微软在这方面的研究探索。在数据层面,可以利用大量单语数据进行数据增强,比如无监督方法来扩展伪数据训练解决低资源问题;在语言层面,通过多个语言输入训练一个解码器共享翻译知识,或者用第三方语言做桥接来辅助低资源语言的翻译。在算法层面,可以利用迁移学习对模型进行预训练然后再做调优。此外,张博士也介绍了微软在模型训练和解码方面的工作,包括半监督联合训练、一致性规范、对偶学习和推敲网络等可提高机器翻译质量的最新技术。

众所周知,认知智能是人工智能的最高阶段,自然语言理解是认知智能领域的皇冠,而机器翻译则是自然语言处理领域“皇冠上的明珠”。

走进2019年,经历了两年多高速发展的“神经机器翻译(NMT)”技术及应用正在面临“成长中的烦恼”,既创造了无数“惊艳”,也带来了很多“吐槽”:从中英翻译的译文质量看,似乎各家NMT引擎正在快速“同质化”,这暗示着NMT的技术发展进入瓶颈期了吗?从技术角度看,对NMT的“可解释性”和外部知识的使用的研究是否有了进展?NMT会突破Transformer,找到下一代模型架构吗?面对一些资源稀缺型语言构建机器翻译引擎,有哪些办法可以改进性能?从应用方式看,机器翻译该怎么用才会让更多人受益?从商业模式看,机器翻译该如何做,才能够做到“高投入高回报”?

机器翻译论坛旨在“构建机器翻译学术界与产业界的交流平台,促进机器翻译产学研共同发展”,已经于2016年5月、2017年9月、2018年5月分别在沈阳、大连、成都举办了三次年度论坛。今年的机器翻译论坛将于2019年5月25-26日在杭州西湖大学举办,5月24日报到,5月25日进行会议研讨,以“机器翻译技术/产业应用报告+圆桌讨论”的形式进行,26日进行自由讨论。我们将邀请机器翻译技术专家学者、机器翻译研发及应用企业高管以及其他各行业的机器翻译爱好者共同参与。

本次论坛由西湖大学文本智能实验室承办、小牛翻译团队与四川语言桥信息技术有限公司共同赞助。热烈欢迎学术界、企业界的朋友积极参与此次论坛,共同畅谈机器翻译产学研!

机器翻译论坛2019专题栏目

相关推荐
5/5

原创视频版权为主办方及译直播所有,请勿擅自使用
7
已有 0 条评论 新浪微博