关于晓译翻译机的研发历程

发表日期:2017-09-29 来源:晓译翻译机 浏览量:

关于晓译翻译机的研发历程

晓译翻译机以其强大的翻译功能准确率而深受人们喜爱,而关于晓译翻译机我们又了解多少呢?

一、最早萌芽于三年前

“晓译”翻译机,最早萌芽于3年前。

科大讯飞多语种翻译业务线副总监马家领是“晓译”翻译机研发团队的负责人。他告诉记者,早在2014年的时候,就有了研发一款翻译机的念头。“那时候我们去新疆出差,发现在不少地方尤其是在南疆,不少人存在语言交流障碍。”马家领说,有人只会讲维吾尔语,根本听不懂汉语,跟他们没法交流,“讯飞成立之初就是做智能语音的,我们就想,能不能做一款产品来解决不同民族间的交流难题。”

马家领说,中国是一个多民族国家,语言种类繁多,“我们亲眼看到交流的不畅,就想在这方面做点事情,让人工智能技术来帮忙扫除民族交流的障碍。”他说,之所以开展这个领域的研究,不仅仅出于企业盈利增收,“可以说我们有一种社会责任感,希望做一件功在千秋的事情。”

二、田间地头采集语言

于是,马家领带着十多人的研发团队,开始了人工智能翻译机的研发。与很多研发团队不同的是,为了让机器真正听懂人类语言,与各种各样口音的老百姓接触、交流,整个团队把大量的时间,放在了新疆的田间地头。马家领告诉记者,他大概有三分之一的时间都在新疆,“让机器直接跟老乡对话,才有感觉嘛。”

今年26岁的安庆小伙吴咏壕是去年8月加入“晓译”研发团队的,毕业于计算机专业的他,在外地工作了几年后,回到安徽加盟了科大讯飞,并进入“晓译”项目组。“我感觉自己挺幸运的,接触并参与了最前沿的科技研发。”不过,研发也很辛苦,吴咏壕说,从去年8月到现在,他去过5次新疆,每次都呆了大概一个月的时间,“一开始我们是在乌鲁木齐等城市,后来逐渐下到偏僻乡村,让人工智能与最原汁原味的语言交流。”

新疆地广人稀,上山下乡并不容易,尤其是研发团队经常去的南疆。“往往我们是先从乌鲁木齐坐飞机去和田,大概要两个小时。再从和田坐车到县里,要花4个小时左右。再从县里坐车去乡村,又要4个小时左右。”吴咏壕告诉记者,他和同事还要适应新疆的温差,“早晚估计有五六(摄氏)度,而且很干燥,所以一般都是团队中的男士去。”

马家领则开玩笑地总结他们在新疆的实地考察工作:“晚上用新疆的时间睡觉,早上用合肥的时间起床。”原来,新疆与合肥大概有两个小时的时差,“这样算算,每天额外增加了几个小时的工作时间。”

在新疆,研发团队也感受到当地人的淳朴和热情。吴咏壕告诉记者,有一次他们开车与一辆摩托车擦肩而过,就打了个招呼想问个路。“因为两边都在开车,所以那个摩托车开远了,我们都以为不会回来了。没想到我们开了一阵后,那个小伙开着摩托车追了上来告诉我们路线,这让我们很感动,也让我们有一种责任感,要为他们做件好事。”

三、拥有英语六级水平

无论是在新疆的乡村还是在合肥的实验室里,马家领的团队做的主要是3项工作,让机器和人类翻译一样,首先识别语言,然后进行翻译,最后将翻译结果讲出来。而衡量“机器翻译”的标准也很简单,就是它翻译的准确率。“准确率的提高,越往后越难。”马家领告诉记者,研发大概进行了一个月的时间,他们就实现了机器的翻译准确率达到60%左右,“但这个数字远远不够,至少要到85%以上,才能实用。”但从60%到85%,就像百米赛跑选手提高成绩一样,非常难,“我们足足花了一年的时间。”就这样,到了2016年的时候,马家领的团队终于做出了一款人工智能翻译机器,拥有了汉维翻译能力。

与此同时,随着2014年、2015年讯飞在中英翻译领域取得巨大突破,研发团队也给“晓译”翻译机增加了中英翻译的功能,“因为现在出国的人也很多,年纪大的人学习外语不是那么容易,他们也需要一款人工智能机器,帮他们实现中英交流,所以我们增加了这个功能。”现在,“晓译”翻译机已经可以快速、准确地实现中英口语间的即时互译,可以像一个真正的翻译一样,为商务旅游、医生问诊等日常工作交流,提供实时自动翻译的服务,“‘晓译’目前在衣食住行等日常生活领域,达到了大学英语六级水平,对于出国的人有很大帮助。”

四、即将替代部分人工

不过,对于马家领的研发团队来说,“晓译”还远远谈不上完美。“翻译有‘信’‘达’‘雅’三个标准,目前‘晓译’还只到‘信’的层面。”马家领说,机器翻译也要像人类翻译一样,首先做到两件事,“一是忠实于原文,二要流利。”马家领举例说,比如有的人说话喜欢引经据典,引用古诗词等,那么现在“晓译”面对这些古诗词的翻译,还存在一定的难度,“不过人工智能的优势在于机器学习,‘晓译’也会不断 学习,会变得越来越聪明。”马家领说,除了现在的汉维翻译和中英翻译外,晓译未来还将拓展更多语种的应用场景,“包含汉藏、汉蒙、中日、中韩、中哈、中俄、中法、中德等其他小语种,它也会学习,应用。”

很多人在展望人工智能技术的进步时,总会设想人工智能未来将让很多人失业,那么讯飞的翻译机器,会让现在的同声传译者们找不到工作吗?对此,马家领说,通过深度神经网络,机器会不断学习,所以会变得越来越聪明,“讯飞翻译机采用的是云端服务,随着讯飞技术的提升,它的能力也会不断提高,用户也能体验到最新的技术。”马家领说,现在“晓译”已经有了英语六级水平,下一步要让它有专业八级水平,“那时就可以取代一部分人工了。”至于能否取代最优秀的同声传译者,马家领表示,他们想创造更聪明的机器翻译,不是要替代人,而是帮助人解决沟通交流中的障碍,“从而让人类腾出精力,去做更有创造力的事情。”