2024年12月25日 星期三

科技 > IT业界 > 正文

字号:  

IT巨头争相布局智能语音新领域 产业将进入爆发期

  • 发布时间:2015-10-10 08:22:00  来源:人民网  作者:王荣  责任编辑:汤婧

  苹果日前声明称,已收购英国人工智能语音技术公司VocalIQ,虽具体收购价格尚未公布,但业内人士表示,此次收购可能帮助苹果改进虚拟语音助手Siri,并有望进一步推进苹果的汽车项目。

  近几年,日产、凯迪拉克等车企探索后视镜智能,并通过依靠语音进行操控,而这些智能语音方案是达讯伟业和科大讯飞深度合作的产物。在炙手可热的智能家居市场中,以语音交互为基础的人机互动模式,也逐步成为标准性功能配置。

  继手动人机交互之后,语音交互领域成为智能领域的另一入口,被各大巨头争相抢夺。

  巨头持续投入

  VocalIQ源于剑桥大学旗下Dialogue Systems Group(对话系统集团),专注于自然语言的理解。其通过使用深度学习来改进语言识别,试图打造科幻影片《钢铁侠》中的Jarvis或《她》中的Samantha。由此,VocalIQ的技术能改进Siri、Google Now、Cortana、Alexa(亚马逊)等一系列虚拟语音助手。

  目前,苹果公司的Siri等语音助手,主要依赖于脚本对话,对特定指令做出应答。但通过VocalIQ技术,可以使用户以会话方式而非设备能理解的提示性语言与设备交互。苹果收购VocalIQ,显然可以通过该技术改进Siri。

  更重要的是,收购VocalIQ还可以推进苹果汽车项目的发展。据悉,今年年初,VocalIQ在官方博客中表示,“车载语音对话系统”能预防驾驶员在驾驶汽车时,因注视车窗外景色而分心。而更早前,VocalIQ与通用汽车联合开发车载语音识别项目。

  事实上,VocalIQ是苹果“进入”汽车市场收购的第二家公司。今年9月份,苹果以2500万美元收购地图可视化公司Mapsense,其主要业务是打造用来分析和可视化位置数据的工具。例如,不同于苹果的Siri和微软的Cortana的愈趋人性化反应,Google Now的“Ok, Google”语言搜寻引擎,一直在专注更准确地分析使用者的话语。谷歌最新在其官方博客中,向我们解释了他们最新应用至其语言搜寻功能的演算法,能通过预测使用者说话的音位(phoneme)来提升准确度。

  巨头在智能语音领域没少烧钱,从语音智能生态系统来看,主要有基于Nuance的苹果Siri与三星S-Voice、谷歌Android的Google Now、微软Windows Phone的Cortana三大版图。

  争夺新智能入口

  大佬的布局是为争夺智能领域的另一入口。近年来,科技创新带来人机交互终端智能化程度的不断提升,传统的交互方式难以全方位满足用户需求,而以语音交互为基础的包括图像、体感在内的第三代人际交互模式,正发挥着越来越显著的作用。

  但智能语音技术的技术壁垒很高,需要企业在统计学、声学、语言学、计算机科学等多个领域,具有较强综合实力。同时,智能语音技术研究周期长、投入大,如IBM已在语音技术领域持续研发近30年。在全球范围内来看,仅有少数厂商在语音市场具备较强竞争力,包括Nuance、IBM、微软、Google等跨国IT企业。国内语音技术市场则处于市场导入期。

  现阶段,智能语音其实并不够智能,准确率低、网络依赖的一系列问题,仍在很大程度上影响了语音交互的用户体验。在语音输入时必须有意字正腔圆地说话,显然这样识别率更高,但人和人在真正交流时并不会如此,有时会说得很快,有时声音则会很低。同时,在噪声及使用方言等情况下,识别率会显著降低。

  同时,智能化水平不高,不能理解做出思考的问题更大。目前语音技术还难以实现对语义的深层次理解,只是将平台的语音识别模块嫁接到软件中,并没有解决语音识别后如何将内容“翻译”成机器理解的指令问题。如果这一点没有解决,语音技术也仅能起到听写引擎的作用。

  可喜的是,当前,语音技术的应用范围正在不断扩宽,也衍生出一系列对语音交互存在刚性需求的场景。例如以可穿戴设备为代表的小型化、便携式终端的交互;远距离、大屏幕终端交互,如智能电视、智能家居、消费机器人等;汽车等不方便使用双手的场景中人机交互。也就是说,应用反向推动技术的进步。

  产业即将进入爆发期

  由于智能可穿戴设备屏幕一般不会太大,甚至没有触控屏幕,因此更加便利的人机交互,就需使用语音进行控制。比如,可穿戴设备的先驱谷歌眼镜,就搭载了智能语音系统,用户通过fiOK Glassfl这句话就可以启动智能对话,然后通过语音就能获得通知及提醒,并在网络环境下,可以通过语音给别人发送短信。此外,包括索尼发布SWR30语音手环,以及全球首款中文智能手表操作系统Moto 360智能手表,均以语音交互为其卖点。随着可穿戴设备在未来渗透率的不断提升,语音交互应用领域将不断拓宽。

  在大屏领域的应用集中在智能电视,包括康佳、长虹、TCL、LG、乐视等,均搭载非常强大语音交互功能,可以通过语音输入,实现包括查收影视剧、听歌、发送微博、开关电视等各种实用的功能。在智能家居中,搭载语音方案也是必不可少的,如苹果发布的智能家居 HomeKit,也是采取与Siri协作的方式,用户可以使用自然语句来发出各种命令,例如“关上我的前门”、“打开厨房的灯”。Siri还能告诉用户家里物品的状态,回答如“我的车库是开着吗?”这样的问题。在未来家庭用的消费人兴起之后,语音技术还将面临更大市场。

  汽车领域则是另一争夺的焦点,由于在驾驶汽车的过程中,使用按键或触控容易引发安全问题,因此各大车厂在前装控制系统中也均搭载了语音控制方案。

  分析人士指出,语音技术水平的提升,与其商用价值的释放,并未能呈现出完全的线性关系。虽语音技术发展已历经长达数十年时间,但由于并未突破大规模商用的节点,因此目前市场规模仍停留在十亿量级。近年来,随着技术不断沉淀,以及语音交互场景的不断拓宽,也预示着语音商用价值的显著提升,语音产业发展即将进入爆发期。

  • 股票名称 最新价 涨跌幅