首页 > 新闻中心 > 行业资讯

人工智能应用千千万 语音识别打响第一枪?

    通过利用机器学习技术进行自然语言的的深度理解,一直是工业和学术界关注的焦点。在人工智能的各项领域中,自然语言处理是最为成熟的技术,由此引来各大企业纷纷进军布局。在未来3年内,成熟化的语音产品将通过云平台和智能硬件平台快速实现商业化部署,前景十分广阔。

  目前,语音交互赛道已汇集了互联网巨头、知名硬件企业、电商平台、传统家电厂商以及各类人工智能初创公司,特别是近几年以智能音箱为代表的语音交互产品在国内外的火爆,极大地激发了语音交互技术的应用和发展。

  语音识别应用领域不断扩展

  在汽车及互联网领域,语音交互功能已经很普及。福特的SYNC系统专为手机和数字媒体播放器配备的福特车载多媒体通信娱乐系统,是目前车载系统中采用语音交互技术的成功的案例,已经广泛应用在福特多个系列汽车中。互联网巨头苹果在其iPhone 4S中推出智能语音助理应用Siri后,Google公司也在其安卓智能手机操作系统中推出了GoogleNow智能语音搜索及问答服务,微软公司也将语音技术应用于WindowsPhone。

  在智能家居领域,不管是智能家电还是机器人,语音识别技术都是必备的基本功能之一。在控制方式上,除了部分智能家电之外,语音控制已经成为了市场的主流,而这就是语音识别市场的商机。未来,作为人机自然交互的前提之一,语音识别必然是智能家居的发展趋势,只有语音识别的准确率接近完美,人机的自然交互才能继续开展。在智能家居市场的推动下,语音识别技术必将成为重点发展对象。

  此外,在新零售领域,智能语音技术的应用也在不断扩展。比如2017年12月18日,科大讯飞和红星美凯龙发布战略合作计划,未来由科大讯飞研发的智能导购机器人“美美”将在全国红星美凯龙门店上市。

  时至今日,资本的涌入、政策的扶持、市场的一再扩容,使得语音技术日益成熟,全球语音市场也迎来了一个应用落地的黄金发展期。根据相关统计数据显示,2016年智能语音产业规模直逼60亿元大关,2017年将破百亿,同比增长69%左右。

  语音识别技术突破总是艰难而缓慢

  尽管技术趋向成熟,但在实际应用中语音识别技术仍存在着这样那样的问题,这些短板时刻阻碍着语音技术的进一步发展与落地。在实际应用中,识别率主要受到以下几个因素的影响:

  对于汉语语音识别,方言或口音会降低识别率;

  背景噪声。公共场所的强噪声对识别效果影响甚大,即使是在实验室环境下,敲击键盘、移动麦克风都会成为背景噪声;

  “口语”问题。它既涉及到自然语言理解,又与声学有关。语音识别技术的最终目的是要让用户在“人机对话”时,能够像进行“人与人对话”一样自然,而一旦用户以跟人交谈的方式进行语音输入时,口语的语法不规范和语序不正常的特点会给语义的分析和理解带来困难。

  此外,识别率还与说话人的性别、说话时间长短等有关。

  科技巨头重磅加码

  在国际巨头纷纷布局智能语音市场时,中国制造企业也正在蠢蠢欲动。中国企业拥有完善的硬件产业链,而这些行业智慧化升级的诉求愈发强烈。以科大讯飞、BAT为首的互联网巨头都蓄谋已久,瞄准这个风口,加速布局智能开放平台,提升产品的竞争力。

  2017年,百度AI开发者大会上,百度发布DuerOS对话式人工智能系统,搭载DuerOS的设备可让用户以自然语言对话的方式进行人机交互;同天下午,阿里人工智能实验室召开了新品发布会,发布第一款智能音箱产品天猫精灵 X1,这款音箱内置智能语音助手AliGenie,能够听懂中文普通话语音指令,并实现智能家居控制、语音购物、手机充值、音乐播放等功能。

  2018年5月3日,从阿里巴巴获悉,由于阿里对北京先声互联科技有限公司(以下简称“先声互联”)的全资收购,先声互联创始人、中科院声学所前研究员付强博士,近日入职阿里达摩院机器智能技术实验室,负责语音交互前端处理技术和方案的研发。

  结语

  毫无疑问,语音智能应用正在飞速发展。在过去的一年里有了极大的发展,从算法到模型都有了质的变化,在加上语音领域(语音合成等)的其他研究,语音技术陆续进入工业、家庭机器人、通信、车载导航等各个领域中。当有一天,机器能够真正“理解”人类语言,并作出回应,那时我们必将迎来一个崭新的时代。


在线留言

确保您输入有效的电子邮件