首页>工业资讯>时评>详细信息

从识别到交互 智能语音技术晋升之路漫漫

来源:时间:2017-03-29 14:16:52人气:努力加载中...
概述:随着人工智能技术的快速应用,语音交互行业在多领域取得突破性进展。但客观而言,目前很多语音智能技术还停留在简单的语音对话阶段,离交互认知还远远不够。 人工智能技术对语音、语义以及图像的处理准确度提高,对输入的信息结合场景更加智能的处理,智能语音和视觉输

随着人工智能技术的快速应用,语音交互行业在多领域取得突破性进展。但客观而言,目前很多语音智能技术还停留在简单的语音对话阶段,离交互认知还远远不够。

人工智能技术对语音、语义以及图像的处理准确度提高,对输入的信息结合场景更加智能的处理,智能语音和视觉输入将成为主要的输入方式,像智能手机、穿戴式设备、智能电视、AR眼镜等设备开始支持语音输入,部分支持手势输入,以及将来的视讯输入

去年11月底,在百度语音平台三周年发布会上,爱奇艺技术总监拿出手机打开了自家的手机客户端,对它发出语音指令:“我的会员没钱了,给我打开VIP充值。”随后App就跳转到了会员充值以及支付页面。

的确,随着人工智能技术的快速应用,整个2016年语音交互行业可谓是突破不断,不仅在语音识别、降噪、声纹技术上有很大的进展,在语音产品商业化也有很多尝试和落地。

以科大讯飞为例。在语音合成方面,科大讯飞实现了全新基于深度学习的语音合成系统,进一步显著提升合成语音的自然度和表现力;在语音识别方面,针对人与人之间自由交谈、会议演讲等场景,语音实时转写通用正确率继续提升,是业界唯一能够在实际应用场景中达到实用门槛的中文语音转写。

不仅如此,科大讯飞在语音交互方面也有所突破。通过语音识别和语义理解在底层的深入融合,科大讯飞研制完成可量产的支持远场识别、全双工、多轮交互、方言识别等特性的 AIUI 产品方案,提升了人机语音交互的成功率和人机交互开发的便捷性,是未来智能汽车、智能家居、智能机器人的关键核心技术。

曾经,百度董事长兼CEO李宏言预言,自然语言的人机界面是下一个发展方向,未来电视、冰箱都可能产生智能应用。那么,如今的智能家电大门真的被语音技术敲开了吗?似乎也不尽然。科大讯飞轮值总裁胡郁坦言,目前的人工智能技术还处于“弱人工智能”阶段,大多还只能达到语音助手的水平。

胡郁所言不虚,从语音交互与识别两大概念看,目前语音技术确实尚未实现认知水平。思必驰首席科学家、联合创始人俞凯强调,语音交互与识别是两种完全不同的概念,“从交互平台上讲,不单单有感知,还要有认知,这个就是所谓自然语言认知交互的未来。把理解和决策表述这样认知技术,与前端强大的识别技术结合在一起,进行更多的搜索和数据处理,才能实现知识意义上更加自由的交互。”

因此我们必须认识到,虽然语音交互已成为未来的发展趋势,但目前很多语音智能技术还停留在简单的语音对话阶段,离交互认知还远远不够。于行业而言,待解难题很多,如对环境的要求,其中噪声问题就是行业难点之一。

另外,搜狗语音交互技术中心负责人王砚峰也指出,目前的语音交互,稳定上做的是不够的,用户预期和技术能力之间有较大差距。此外还有诸如,对说话有距离的限制、不能持续对话,以及不可打断等问题存在。

既然语音智能还未实现交互认知,技术只达到语音助手的水平,同时面临诸多难题。这是否意味着智能互联网的基础人工智能技术将迎来第三次退潮?

对此胡郁表示,“以前的人工智能退潮都有一个现实的问题,没有从研究阶段转到使用阶段,但现在这次浪潮中我们可以看到,已经在很多方面真实应用了。”人工智能的这一波浪潮能达到怎样的高度目前还不知道,但他认为,与其在浪潮中去预测,倒不如加速手头正在进行的研究。 

相关资讯