现场王小川首秀搜狗“黑科技”——机器同传,展示了实时机器翻译技术,将演讲嘉宾的中文讲话实时语音识别并同步翻译为英文上屏显示,引起轰动。这是全球首次基于神经网络的实时机器翻译技术在大型活动上的展示。
11月17日,第三届世界互联网大会于乌镇举行,由科技部主办," 搜狗公司协办的移动互联网论坛上," 搜狗CEO" 王小川与" 联想集团董事长兼CEO杨元庆、" 华为消费者业务CEO余承东、脸谱公司副总裁" 石峰、" 斯坦福大学客座教授杰瑞·卡普兰等人共论“人工智能开启互联网新未来”,并发表了主题为《人工智能的未来之路》的演讲,现场" 王小川首秀搜狗“黑科技”——机器同传,展示了实时机器翻译技术,将演讲嘉宾的中文讲话实时语音识别并同步翻译为英文上屏显示,引起轰动。
这是全球首次基于神经网络的实时机器翻译技术在大型活动上的展示,效果可靠、准确率已接近人类同传翻译结果。基于这项技术,演讲现场屏幕上除了语音识别实时显示的中文内容外,还有机器同步翻译的英文内容,实时生成了演讲内容的双语滚动字幕,如当" 王小川说到“搜索的未来就是人工智能时代的皇冠”时,屏幕上实时显示出了“In the future, search will be the Crown of
the AI Era”,机器还能随着语句的逐渐完整,根据语义自动修改调整之前识别的内容,引起全场嘉宾、媒体的关注。杰瑞·卡普兰等外宾们纷纷摘下同传耳机,感受这不同寻常的“同传”。从现场演示效果来看,搜狗语音识别准确率已超过97%,机器翻译准确率达90%。据悉,在近期人工评测中,搜狗机器翻译在演讲、旅游、闲聊、日常口语等领域,采用五分制人工评分能达到4.4分,走向实用化。
" 王小川表示:“这是搜狗自研的机器同声传译,融合了业界领先的端到端神经机器翻译技术以及基于实例的翻译技术,基于大数据和深度学习,涵盖了搜狗自主研发的语音识别、机器翻译两项重要技术。利用注意力模型聚焦源端,使用循环神经网络生成翻译结果,翻译的结果比传统机器翻译更加流畅,效果更好。”
搜狗其实早在2011年便开始深耕语音识别技术,至今已有5年积累。凭借几大得天独厚的条件:大量的数据资源、庞大的用户量,以及领先的算法,目前搜狗语音识别准确率已超过97%,识别速度达到了400字每分钟。技术进步下良好的用户体验,也带来了用户使用量的提升,搜狗第三季度财报显示,目前搜狗输入法的语音输入日频次比一年前增长一倍多,单日语音请求突破1.9亿次。
今年7月,王小川在极客公园的奇点大会上,已经秀过搜狗的实时语音识别技术,将演讲识别为文字,同步上屏,率先落地人工智能产品。此次世界互联网大会上,搜狗的语音识别技术再进一步,将人工智能技术应用拓展至语言翻译领域。机器对于自然语言语义的理解一直是人工智能领域的难题,搜狗这项黑科技堪称重大突破。
王小川指出,虽然目前搜狗语音识别准确率已超过97%,但今天的语音识别与机器翻译仍然存在瓶颈,不过随着人工智能技术的进步,这一问题将会进一步得到解决。伴随机器的学习能力增强,我们将从NLP(自然语言处理)走向NLU(自然语言理解),并向机器的自动问答迈进。“搜狗的使命是让表达和获取信息更简单。实际上,搜索就是在帮助人们获取信息,而输入法则在帮助人们进行表达。未来,搜狗会通过自然交互和知识计算,促进更多人工智能产品的落地,切实造福人类。”王小川最后总结道。