From BD to DD:从大数据到深数据 – 张晓炜


人工智能时代口译技术应用研究
王华树 | 国内首部聚焦口译技术应用和教学的著作
新书推荐


口笔译教育与评价国际论坛 二号公告
在厦门大学百年校庆之际,邀您齐聚厦门、共襄盛举
论坛推荐

From BD to DD:从大数据到深数据 - 张晓炜
play-rounded-fill

From BD to DD:从大数据到深数据 - 张晓炜

“艺果杯”翻译技术大赛颁奖盛典
观看大赛全程直播盛况

大赛介绍

        “艺果杯”翻译技术大赛是由上海艺果信息咨询有限公司(上海艺果)举办,由翻译圈内项目经理参加的大赛,经过初赛、复赛及决赛,理论及实战项目比拼考核,最终一组(2名)项目经理胜出获得冠军(奖励为价值3万多人民币的专业软件及现金)。今年“艺果杯”为首届。

主办方“上海艺果”是一家专业的信息咨询公司,为企业客户、翻译公司、翻译团队及个人提供翻译项目管理、技术处理、技术支持以及DTP排版等专业服务。服务翻译行业从业者,提升翻译行业价值,帮助所有希望提升的语言服务企业、翻译公司、翻译团队和自由译者。

大赛目的:助力行业发展、推广翻译技术、提升翻译项目管理水平、汇聚项目管理精英人才
指导单位:语资网
组委会:包亚芝、左仁君、李艺峰、田惠才
专家委员会:崔启亮、师建胜、王华树、李艺峰、彭成超、李向东、乔溪、田惠才
主办单位:上海艺果信息咨询有限公司
协办单位:瑞科翻译
                    上海唐能
                    河南北极光
                    译马网
                    快译猫
                    Tmxmall
                    译直播
                    译讯科技
                    本地化人网
                    大辞科技
                    memoQ
                    小牛翻译
                    深圳云译
                    嗨翻网
                    华夷通

议程安排

“艺果杯”颁奖盛典议程
时间 环节/流程
上午(3小时30分钟)
8:20-8:50 30分钟 签到
9:00-9:02 2分钟 开场视频
9:02-9:10 8分钟 主持人开场
9:10-9:15 5分钟 比赛准备,选手候场,主持人介绍规则
9:15-11:00 105分钟 PPT展示
评委评分
评委点评
11:00-11:04 4分钟 主持人串词
11:04-11:08 4分钟 小游戏
11:08-11:09 1分钟 主持人串词
11:09-11:29 20分钟 终极PK
11:29-11:31 2分钟 主持人串词
11:31-11:36 5分钟 现场抽奖
11:36-11:37 1分钟 主持人串词
11:37-11:40 3分钟 揭晓冠军
11:40-11:55 15分钟 颁奖
11:55-12:30 35分钟 大合影
中午(1小时)
12:30-1:30 60分钟 午餐+午休
下午(3小时15分钟)
13:30-13:35 5分钟 主持人开场
13:35-14:05 30分钟 信息化技术及人工智能能对语言服务行业的影响(传神企业语言解决方案负责人 李敏)
14:05-14:35 30分钟 From BD to DD:从大数据到深数据(中航工业研究员、坦克特级射手 张晓炜)
14:35-15:05 30分钟 企业业绩暴涨,老板身心解放——如何提高企业老总营销力(慧百NLP营销专家 雅静)
15:05-15:35 30分钟 “问诊”机器翻译(小牛翻译 张春良)
15:35-16:05 30分钟

传统翻译公司——AI 时代 新机遇(人工智能翻译顾问、经济学在职博士、北大语言工程硕士 刘劲松)

16:05-16:35 30分钟 Panel Discussion
16:35-16:45 10分钟 撤场

评委及嘉宾介绍

评委(按拼音排序)

曹珍辉
VMware威睿科技有限公司本地化高级经理,负责公司所有产品的本地化,为全球客户提供更好的用户体验。专注于通过软件国际化标准平台来实现产品本地化的自动化、流程化,充分利用机器翻译(实现SMT到NMT的转换)来实现快速和连续交付。为保证质量,VMware通过量化人机交付的通用指标和机翻内容的预处理和后处理得以实现。积极参加国际和国内校企合作,多次在北京大学、北京语言大学、北京师范大学、外经贸大学、北航进行分享,在TAUS和LocWorld年会分享VMware新工作和新方向。

崔启亮
博士,对外经济贸易大学英语学院副教授、硕士研究生导师、国际语言服务与管理研究所副所长,中国翻译协会理事,中国翻译协会本地化服务委员会副主任,世界翻译教育联盟翻译技术教育研究会副会长,北京大学硕士研究生导师,南开大学硕士研究生导师,西安外国语大学“西外学者”特聘专家,《上海翻译》杂志编委。编著本地化与翻译技术学术与实践书籍6本,出版2本行业调查报告,发表论文30篇。

李梅
同济大学教授,博导。上海市科技翻译学会副会长、WITTA翻译技术教育研究会副会长。翻译作品200余万字。出版专著、译著6部。汉英译著《中国名园》获中国图书大奖。近年来研究兴趣聚焦机器翻译译后编辑以及技术传播。

刘劲松(Patrick Liu)
人工智能翻译顾问、经济学(在职博士)、北大语言工程硕士。曾任外企多语言翻译咨询顾问;语言学及翻译技术课程讲师;德国技术传播协会(Tekom)和中国标协技术传播认证 技术沟通(TC)培训讲师。
研究兴趣:人工智能;跨文化沟通;技术写作;多语言本地化

蒙永业
博士,北京悦尔信息技术有限公司董事长,中国语言服务40人论坛组委会主任;ISO语言服务标准工作组专家、中国工程建设标准专家库特邀专家;中国翻译协会口译委员会副秘书长、《口笔译人员基本能力要求》、《翻译服务 口译服务要求》等标准主编;河北大学兼职教授、河北民族师范学院客座教授、对外经济贸易大学、北京工商大学等大学翻译硕士实践导师。

彭成超
译马网首席增长官,四川翻译技术沙龙联合发起人,中国翻译协会标准《语料库通用技术规范》起草人之一。曾先后在知名本地化企业和传统翻译企业从事翻译、项目管理、本地化工程等工作。熟悉各种翻译技术工具和翻译及本地化作业流程,深谙翻译生产痛点与翻译技术应用之道。其主导设计的译马网已服务2000多家翻译企业,成为国内翻译企业的首选翻译生产平台。

张井
Tmxmall创始人兼CEO,现语资网副理事长,2013-2014年就职于百度钱包,担任百度钱包生活应用服务及打款技术负责人。2014年9月创立上海一者信息科技有限公司(Tmxmall),多次担任国内外重要语言服务行业会议的演讲嘉宾,担任2016、2018TAUS北京高峰论坛组委会成员,同济大学、上海对外经贸大学、对外经济贸易大学等多所高校MTI校外导师。

郑金凤
RWS(中国)副总经理。2007年加入全球IP语言服务公司RWS Group,在专利翻译、资源管理、项目管理等多个岗位工作。现负责公司运营管理及战略性校企合作项目,制定人才策略,规划校外实习基地的建设和运营。兼任对外经济贸易大学、西安交通大学等高校的MTI校外导师。

嘉宾(按拼音排序)

顾小放
中国译协翻译服务委员会副主任委员兼秘书长
多次主持本单位对外引进项目资料的翻译组织和管理工作;GB/T 19682-2005《翻译服务译文质量》的主笔人之一;ZYF《翻译服务采购指南 第1部分笔译》的主要参与者之一;ZYF《翻译服务报价规范》(口译、笔译)的参与者之一。

胡新华
知识产权出版社翻译事业部主任、副研究员。华中科技大学软件工程硕士。
1999年入职知识产权出版社,先后从事软件工程师,技术支持工程师,技术开发中心主任,翻译事业部主任等岗位。2001年作为主要工程师参与国内第一条专利文献数字化OCR生产流水线建设,该系统2003年实现专利文献历史档案全部代码化;2005主持中国专利数据初加工项目,该项目对中国专利文献著录项目进行了标准化加工;2010年主持国家知识产权局数字出版平台课题,首次实现非专利知识产权文献(图书、期刊、法院判例等)数据完成收集和一站式检索;2014年创建“I译+”品牌,建设首个专利文献互联网翻译平台——“I译+知识产权语言服务平台”,目前,该平台注册专业译员超过6000人,每天翻译50万字。

江伟
英语专业毕业。从事英中笔译20余载,完成翻译和本地化项目近万个,擅长以技术的手段解决技术的问题。活跃于国内外多个翻译和技术论坛,潜心研究生产力工具开发和流程优化。

江心波
快译点、BesTrans译百创始人,山东省翻译协会副秘书长,2012年创立译百翻译;2014年组建快译点智慧云翻译平台研发团队,并于2016年推出快译点个人版翻译辅助产品,2018年推出快译点智慧云翻译平台企业版。

李敏
传神语联企业语言(软件)解决方案负责人。2007年入职传神,12年间一直致力于计算机辅助翻译系统及翻译过程管理平台化管理体系研究和产品管理,曾主持“中国日报社中英文协同编译网络平台”,“中国体育多语信息传播服务平台”,“全民健身多语服务平台”、“中国新闻出版多语种语料库”、传神“TPM翻译项目管理平台”以及“企业多语言协同翻译平台”等多个大型互联网项目。

李向东
三河市语联翻译服务有限公司经理。公司由多名十年左右项目管理经验的项目经理组成,擅长处理格式复杂、文件众多、工期紧张的大型翻译项目。

李艺峰
艺峰讲师团联合创始人、传神语联资深本地化工程师,CAT工具高级咨询师、CAT工具培训师。多年实际项目运作经验,精通各种翻译工具。

刘小丹
四川译宝联科技有限公司快译猫市场总监。曾任职西安金科翻译服务有限公司副总经理。具有十余年从事翻译市场开发和管理工作经历,具有较丰富的翻译行业从业经验,对中国的翻译市场现状有较为深刻的认识,对翻译行业有独特的见解和领悟。

尚照发
上海大辞科技市场总监。深谙语言服务市场,翻译和本地化发展脉络。曾为多家行业公司、翻译与本地化公司、翻译技术公司、机器翻译公司、人工智能机构提供咨询。关注MTI教育、师资建设、学生培训与实习实训,上海对外经贸大学企业导师。

雅静
中小型企业内训策划讲师、悦力量联合创始人、中国一对多行销演讲成交高手、全国大学生创业就业导师、当代大学生心灵成长励志梦想导师。

张娟(Joanna)
唐能翻译深圳分公司总经理。大学毕业后留校负责外教招聘管理工作两年,后加入唐能翻译上海总公司,在客服和销售、项目管理,资源招聘和管理等多岗位上历经锤炼。2010至2018年曾任唐能翻译副总经理。

张晓炜
中航工业研究员、中国翻译协会会员、坦克特级射手。
长期从事武器运用工程及JLVC一体化联合训练体系研究,熟悉各型武器系统,对外军联合训练有深入研究。近年来,研究兴趣聚焦为军事装备与训练深数据分析挖掘。先后主持陆军“国际军事比赛装备数据挖掘与分析”及“陆战智能化综合训练系统”等项目。曾主讲外军留学生“坦克武器系统”、“武器射击学”等课程。核心期刊发表论文十余篇,翻译著作100余万字。获国防发明专利6项,软件著作权3项,已完成及正在进行的军委科技委、陆军研究院等项目10余项。

章建民
四川译讯信息科技有限公司副总经理。从事翻译行业市场销售近二十年,是四川译讯信息科技有限公司创立创建、公司产品市场开发创新主要成员之一。

朱小二
上海对外经贸大学翻译硕士。现任大辞科技、memoQ产品经理,翻译与本地化方案构架师,专注于企业语言技术应用和项目管理实践。
著有《memoQ实战》翻译项目实践手册,安庆师范大学外语学院校外兼职导师,教授《计算机辅助翻译》课程。

朱颖
唐能翻译公司北京代表处负责人。十年翻译行业浸润,十年服务外企大客户的经验,十年北京团队管理经验,带领唐能北京业务稳健增长,助力上海唐能总部快速发展。

左仁君
瑞科翻译有限公司联合创始人、总经理,语资网秘书长、中国翻译协会翻译服务委员会委员,中国翻译协会本地化服务委员会委员、江苏省翻译协会理事。15年语言服务行业从业经历,专注于客户关系管理、项目管理、翻译人才队伍建设和培养、翻译行业发展等方面的实践和探究。并有连续8年的翻译项目管理经验,为三星、三一重工等企业提供过翻译和咨询服务。现担任上海师范大学、南京师范大学、大连海洋大学、南京林业大学、沈阳建筑大学、上海海事大学、安徽工业大学等高校翻译专业兼职导师,多次受邀到全国近百所高校做专业讲座和课程。

陈凯
郑州点睛多语言翻译服务有限公司总经理,点睛DTP团队创始人。河南工业大学英语专业毕业,带领团队潜心dtp多语言排版11年,多次参与业界大型翻译项目,累计完成图纸30多万张,文档类400多万页。

张春良
国内规模最大的机器翻译产学研团队——小牛翻译团队创始合伙人、东北大学外国语学院副教授、MTI导师。

分享嘉宾:张晓炜

中航工业研究员、中国翻译协会会员、坦克特级射手。
长期从事武器运用工程及JLVC一体化联合训练体系研究,熟悉各型武器系统,对外军联合训练有深入研究。近年来,研究兴趣聚焦为军事装备与训练深数据分析挖掘。先后主持陆军“国际军事比赛装备数据挖掘与分析”及“陆战智能化综合训练系统”等项目。曾主讲外军留学生“坦克武器系统”、“武器射击学”等课程。核心期刊发表论文十余篇,翻译著作100余万字。获国防发明专利6项,软件著作权3项,已完成及正在进行的军委科技委、陆军研究院等项目10余项。

大家下午好。非常荣幸有这么一个机会跟大家交流。今天这个会议是我们翻译行业的一个会议,但我要讲的内容呢,可能想分享的是一些跨界的信息。参加这个之前我还,因为我跟李艺峰跟田老师是多年的好朋友,我对组织和举办这次翻译技术比赛,当时有些担心,但是今天上午我参加完上午的每个人的分享和颁奖典礼之后,我先说一个个人真实的感受,我觉得可能我们这场活动虽然规模不大,但是可能是我们翻译行业或者翻译技术发展的《流浪地球》的一个小事件。为什么这么说呢?虽然我们今天做的事情大家可能在方式方向上看不到《流浪地球》这样轰动的效应,但是从我个人内心来讲,以我浅薄的对于翻译行业的了解,我认为其今后的意义有类似开创性的意义。但为什么我敢下这么一个断言?这个答案我放到分享之后,我放到结尾再去分享。

我要分享的内容,从田老师发的邀请给我这个任务之后我就在想,在面对我们翻译行业自然语言处理各位专家同仁,到这样的场合,我适合讲什么样的内容?想来想去最后想了这么一个题目叫“从大数据到深数据”,from BD to DD,刚才艺峰也做了铺垫,的确是这样,我本来还没有想好,我说怎么样把我原来在军事领域做的事情,能够跟我们翻译行业做一个简要的过度和阐述,我觉得他刚才已经把这个话题说出来了。刚才李总也从传神AI关于行业的发展,我看了也很惊讶,因为客观讲,我曾经也有过做这个译者的经历,曾经做过一段时间军事的经历,原来我干了十多年大位老师,中间也是坦克设计手,中间穿插了同声传译,对翻译行业只能讲有一定的了解,我感同身受翻译是很苦的差事,不像很多其它行业有光鲜亮丽的色彩,我们的工作都是幕后的。所以看到翻译行业有这样的局面,我们译者无论从体力还是从简单重复性的过程当中解放出来,这不得不讲是科技的进步,也是技术的进步,也是人类的进步。

接下来谈谈我对于大数据到深数据趋势发展的看法。
首先准备谈些什么呢?想了一下,为了方便跟大家交流,从两个方面吧:一个是简单的汇报一些我在从事相关工作的经历,以及在人工智能大数据行业里的一些故事。同时也希望借这么一个场合,能够跟自然语言处理行业的同仁开一些脑洞,试图穿透当下的现象,去洞见未来的趋势。刚刚李总从AI的角度讲了一些传神在做的工作,我从我之前的经历做一下分享。

2018岁末到2019,大家都在传一句话,讲中国经济什么呢?2019中国经济将是过去十年最差的一年,但也将会是未来十年最好的一年。这个结论无论对错,我认为没有太大的意义,因为大家都知道,任何时代都是最好的时代,同时也是最坏的时代。所以呢,不管对错,就我个人而言,我还是认为2019的人工智能同样也符合这个逻辑,它一定也是同时是最好的一年,同样也是最坏的一面。为什么呢?因为现在从事这个行业的很多人,现在声音很多也很杂,有的人在讲人工智能的冬天来了,也有人在讲人工智能的春天才刚刚开始。从我个人来讲,这种讨论都是好的,但是争论没有太大的意义,因为不同行业有不同行业的情况,就像到底是你做的问题是大数据还是深数据?这也是根据不同的应用、不同的行业有所不同的定义。

但是有一个现象大家可以形成共识的,无论从学术界还是行业里面,把人工智能简单划分为三个阶段:第一个阶段是计算智能;第二个是感知智能;第三个是刚刚兴起的认知智能。感知智能这一块,前两个阶段已经发展到相对比较成熟,而且发展速度很快。你比如说感知智能里的图象识别,语音识别包括讯飞和传神做的一些事情,都是感知智能里的事情,这块发展很快。但是认知智能刚刚兴起,远没有走向快车道的发展阶段,而且认知智能很难。所以当前人工智能的能力相对人的智能体来讲还是非常弱的,这是我个人的看法。

但是有一些深刻的变化正在发生,我认为现在当下无论是中国还是全球的科技正在从一个深度的数字时代向认知时代快速的迈进,这个变化体现在哪里?李总刚才讲冰山一角,我笑了一下,大家想到一起了,他是从那个角度这是我在互联网上找的一张图,讲互联网创新和AI创新的区别。什么意思呢?在海平面以上露出的冰山其实只是冰山一角,它的体积是非常有限的,真正庞大的本体在海平面以下。对于创新来讲,有很多人是有这样看法,我是非常认同的,把互联网的创新看作,它解决的问题是解决信息不对称的问题,我说完大家也清楚,我们国家互联网前几年很热,从去年过了以后,互联网行业的变化很大,无论裁员潮还是格局的调整,前几年的发展很多是从国外抄过来的,首先解决了信息不对称的问题。但是对于AI的创新,大家都认为它主要解决的是环境数据感知与决策问题和传统行业深度融合的问题,这个看法对不对呢?我结合我自己这两天做的一些工作来跟大家做一个探讨。

大概从2015年开始,因为工作原因,我原来一直在军工学校、航空体系工作,一直在参与做国际军事比赛数据挖掘相关的工作。这个事情在座的部分对军事热爱的朋友比较了解,2014年习总上台以后我们每年跟俄罗斯搞不同的军事比赛的项目,最早的一些比赛到最近有炮兵比赛、特种兵的还有其它的。我现在主要是在做数据挖掘的平台和针对坦克装甲陆军的多一些,涉及到人员、武器装备、环境以及比赛期间互联网的数据,大概是四个大维度的数据做深度挖掘分析。解决的问题一定是一个垂直行业的问题,比如说比赛之前我们国家应该选用什么样的武器装备型号,以及做什么样的加改装的方案能够更有利于我们国家去比赛,比赛过程当中怎么样改进比赛和训练的方法,提供一些辅助决策的意见。包括赛后做深度的分析计划,这就是美国人现在比较热的叫事后分析。

这个过程中我有一个感触,用到的数据非常大,但是维度非常小。小到什么程度呢?我最早做的是这样一个问题,就是如何客观量化的评估一个优秀的射手,我原来除了教学之外,我们必须要求每一个教员都得是特级以上的射手,我打了十几年,摸了十几年的装备,我非常知道去量化评估一个射手对于现在当下的这个互联网的工具,或者AI的这种工具它的难度有多大,客观来讲很难的。今天我不讲一个公式、不讲一个术语,只是跟大家聊一下我的个人体会。

后来这个工作我们做出来了,只放其中一个小的算法,就是四个曲线,这个是2015年做的模型,这个是算出来的结果。这个结果很像平时到医院拍的心电图。如果我是一个大夫,拿到一个心电图就知道你心脏的健康程度。对于我,大家看着是没有什么意义的四条曲线,对于我来说我就能看出来这个射手是否优秀、是否合格,这台装备好还是坏,以及比赛场地有什么样的问题。之所以做到这一点,它所用到的是什么呢?就是我自己认为,一个新的概念,这个新的概念是什么,我当时不知道,但是只是我认为它应该不是大数据,我做这个工作,包括你们在座的各位,我随便挑出一个人来,我给你一个坦克让你上车,按照我的1234操作流程操作一遍,我就可以知道你怎么样在最短的时间内完成更高质量的操作,这个过程显然是要用到大量数据的。

包括在这个过程当中,我们也专门的,当然这个工作现在还正在做,还没有完成,还会专门的去设计适应这个问题专用的神经网络。大家都知道神经网络只是大数据人工智能的一个工具而已,之前我们有很多都是用海外的数据在这个上面工具方法去跑就行了,但是很少有人专门设计一个专用的神经网络。打个比方我们的交通工具,一个物体从A点运到B点,理论上好像只要有交通工具就行了,但是我们有飞机、有火车、有轮船,我们车还有私家汽车、有卡车、有大巴车、有不同的类型,不同的工具干不同的事情,这个事情我认为在当下的AI人工智能领域还没有全面的发生,仅仅只是一个开始,但是它的意义呢是及其重大的。

回到冰山这个话题,这个词是我自己造的,妥当不妥当,有没有意义,我算不上学究,喜欢这个字眼,叫他深数据也罢,叫他高阶数据也罢,叫做数据模型也罢,都可以。总而言之大体的意思,我们少量小样本的数据,或者顶多是一个中数据,跟你垂直领域的知识相结合所解决的问题,是我认为当下AI创新最现实的应用。所以AI当下的创新,还到不了互联网动辄就要改变人类生产方式的程度,我认为这是一个伪命题,AI的智能远没有到那样的程度。所以这是我个人的判断。

至于到底什么是深数据呢,我自己也没有一个很确定的答案,只是跟大家做一个分享。我跟朋友开玩笑,这是我自己养的猫,我说什么叫灵魂的声音,我每天回家上楼之后,这个猫就会早早守在门口,他知道我要回来了,能够听到我的脚步,我们熟悉的家人在5楼,它上到3楼就知道它的脚步,你能精准的分辨出来我说这就是你能够听到灵魂的声音。这用的是什么呢,就是小量的深数据。

再比如我随便告诉你23度代表什么呢?不知道,它是可以是一个角度,也可以是一个电量,也可以是一个旋转的角度,或者也可以是一杯咖啡的温度。只有当我告诉你,比如中国北京宣武区今天的气温是23度的时候呢,这条信息才能帮你解决问题,给你带来价值,比如你想到今天穿什么样的衣服,针对我们有限知识的人来讲,我们想到这应该是北京的春天来了。

所以我们核心的之词,领域知识或者显见知识,有了垂直领域的先验知识,我们用少量的数据就可以做一定的事情,大风起于青萍之末,履霜坚冰至。这都是我们人类对大自然的洞见,就是“通几”,“向数理”,大数据做的是“向”的问题,我们有很多的方法和工具是数的问题,最后抽出来的是“理”。深数据更接近“理”的层面,有低阶的也有高阶的,现在我认为已经从低阶往高阶走,只是简单的摄像头、麦克风或者简单的大规模的数据,现在已经不足以支撑AI深度的创新,这才是穿透的力量。

所以分享这么一个判断,从2019年应该有很多从大数据向深数据发展。AI工具与细分垂直领域的结合,可能是2019年人工智能全新的蓝海,而且应该能够撬动一些事情。

包括前几天来之前在网上看到的帖子,它是投资行业的人做的分享,说什么样的人工智能项目值得投,提了“六投三不投”,分享一下“六投”。第一如果你看到它是从垂直行业入手,而不是上来就做大项目,上来就宣布改变人类生产方式、跨时代,这样的值得投。第二个明确垂直领域应用场景,像我们这个就是针对国际军事比赛,当然还有其它不同行业的,电子行业等等。第三看项目有没有优质的头部客户。第四看它的应用场景是不是够low,这个难理解一点,主要讲的意思,因为人工智能主要的冲击的对象是很多简单重复低成本的工作,如果你的应用场景很高大上,往往这样的适用起来,往往你实现一个算法和模型可以替代上千人重复简单的劳动,在这样的场景下往往应用不起来,这个项目就不容易成功。第五个就是强大的工程和服务能力,就是可以落地。第六个团队的演进能力强,演进能力强,其实就是跨界,人工智能行业的人才已经开始,我感觉逐步得有些过剩了,我年前招聘的时候,很多互联网行业、金融、PPP的人出来,很多原来为了学AI而解决AI经常做的跨界的一些人出来,这是我观察到的现象。以上从我个人来讲,六点建议是比较中肯的,大家如果你还能够再打造一个生态就更好。

最后我们还是务虚,如何结构海平面下方的冰山,不管是自然语言行业的朋友,还是我从事军事和航空的一些工作,都需要有一个信念,就是说认为我们所生活的是一个数学的宇宙,是一个可被结构、可被洞见的数学的宇宙。

这就像19世纪傅立叶所说,所有的乐声,不管器乐还是声乐,都能用数学表达式描述,它们都只是一些简单的正弦周期函数的组合。之前说很难,难就难在这一点,但是我后来发现它都可以用数学来去进行结构。所以这个也就是我们值得为之努力的而且有趣的地方。

所以,我的一个看法,也算是呼吁,希望大家多思考,怎么样结合深数据的方式去撬动一些新的应用,来洞见更多我们所生活的数学宇宙的奥秘。这就像大家刚刚看完《流浪地球》一样,我说这件事情不是科幻,为什么呢?因为这儿我不给自己打广告,我给田老师和艺峰打个广告,我们之前除了朋友关系以外,也在着手做科技智能情报的工作,这个直接的应用,很多会直接应用到军事领域。这个领域的应用,现在国内的确跟美国人差距还是挺大的,你比如我简单说一个,大家可以搜一下,美国有一个“深绿计划”,是面向未来的评估它的最前端有一段就是直接自然语言处理方面的技术方法在军事领域的应用,它的指挥官,他在自己的意识层面快速的在战争指挥过程中程度一个草图,有一个草图的系统转化成可读的文本,这个叫DBP的工作,在DBP完了之后有一个inset的系统,然后把它整个转化成可被理解、可被执行的军事的响应,响应大家不熟,相当于拍电影的脚本。后面再用我们做的仿真的系统,美国人叫水晶球、闪电不同的系统做两个空间的并行推演。这个听起来很科幻,像美剧《安德的游戏》的场景,但是我可以负责任的讲,在我实际工作当中这些事情都在发生,而且我后面会陆续持续更大规模的给田老师那边有很多的军事翻译,不能叫军事翻译,应该是智能科技情报方面的一些工作,我们会深度的合作,也欢迎大家能够去有更多的分享,我也相信在座的每一位将来都是我的老师,我能够从每一位身上学到新的东西。

最后我分享一句话,我个人性格低调,但是从我们做的事情我还是很骄傲。很多人我们之前谈过的很多的事情,很多人都说我们是在吹牛逼,但是很不好意思,人类曾经吹过很多牛逼,都已经变成现实!包括我们之前看到的很多的事情,目前都已经变成了现实,就像今天这场活动一样,我认为翻译技术在翻译行业朝着跨界深度应用、附加值高度应用的这么一条路已经开始梦想照进现实,就像我个人信念一样,追求利于自己利于他人,希望这场活动利于我利于大家。

2019祝贺大家,谢谢大家!

相关推荐
5/5

原创视频版权为主办方及译直播所有,请勿擅自使用
4
已有 0 条评论 新浪微博