硅基(jī)麦克风的出现重塑了音频领域。市场研究公司Yole Development相信(xìn),在未来几年,人工(gōng)智能将(jiāng)引领(lǐng)市场演(yǎn)变(biàn)和转型。
语音交互是(shì)自(zì)然的,这就是为什么它(tā)正在(zài)成为人机交互的主要(yào)接口。基(jī)于语音(yīn)的(de)个人助理(VPA)在智能手机、智能音箱、智(zhì)能(néng)手表、无线耳机、汽(qì)车、智能电视及其遥控器中(zhōng)越来越受欢迎。现在甚至垃圾桶都集(jí)成了语(yǔ)音识别。而(ér)真正的价值在于(yú)高音频质(zhì)量和对麦克风周(zhōu)围环境(jìng)的理解。
对(duì)于Yole development来(lái)说,音频是下一(yī)个被人工智能(AI)渗透的领域。
人工(gōng)智(zhì)能如何发声
基于语(yǔ)音(yīn)的虚拟个人语(yǔ)音助理(VPA)是当今音频(pín)行业的主(zhǔ)要驱动力(lì)。基于音频系(xì)统(tǒng)的传统组件,如音(yīn)频编解(jiě)码器、麦(mài)克(kè)风、扬声器和(hé)音(yīn)频(pín)放大(dà)器,他们都在使用人工(gōng)智能来计算和分析语(yǔ)音数据。例如(rú)计算支持复杂的(de)音频功(gōng)能,如(rú)语音识别和源定位。它可以(yǐ)在云中(zhōng)执行,也可以在消(xiāo)费设备的边缘处执行。这些分析在(zài)云中执行需(xū)要(yào)很高的(de)处理能力和访问大量数据,。
Yole光电和传感(gǎn)部门的技术(shù)和市场分析师(shī)Dimitrioses Damianos表示(shì):“人(rén)工智能的附加价值是用于(yú)自然语言处理,声音是与机器互动的(de)一种更自然的方式。你(nǐ)不需要使(shǐ)用键盘和(hé)双手,你只需要(yào)发声(shēng)即可。然而,为了理(lǐ)解(jiě)用户在说什么,他们的语言以及他们的意思需要进行大量的(de)处理(lǐ)。“人工智能正在增加解码(mǎ)的价值,并帮助我们与设备沟通。”
当被问(wèn)及VPA的(de)快(kuài)速(sù)渗透时,Damianos将(jiāng)其归(guī)因于其便捷(jié)性和效率。当(dāng)然,“我们相信和看到(dào)的是(shì),像谷歌、苹果、Facebook、亚马逊和微软(统称为GAFAM)这(zhè)样的大(dà)型科技公司试图推动这些VPA,因为它们提取的数(shù)据(jù)有真正(zhèng)的价值(zhí)。”
Yole公司(sī)MEMS和传感器部门的(de)技术和市场分析(xī)师Alexis Debray:对于(yú)用户来说,音频比图像更容易被接受。他们认为音频“不那么具有侵入性,所以这是GAFAM从人(rén)们那(nà)里收集数据的好方(fāng)法,GAFAM的(de)主要业(yè)务就是数据。一些公司(sī)利用(yòng)数据做生(shēng)意,而另一些公司利用隐私和设置技术(shù)来确保用户(hù)的隐(yǐn)私(sī)。例如(rú),苹果公司(sī)就宣扬隐私,并使之成为(wéi)强大的营销资产。
Damianos说到:对大型科技公司来说(shuō),它们(men)的(de)实际价值(zhí)是尽可能多地从环境(jìng)中提(tí)取信息,这意味着VPA不仅会倾听用户的声(shēng)音,还会(huì)倾听他们(men)周围的环境(jìng),并了解他们的(de)环境。例如,“如果你在(zài)厨(chú)房里,麦克风(fēng)可(kě)以听到(dào)刀(dāo)架在柜台上的声(shēng)音,立(lì)刻就(jiù)知道你在厨房里,并给出一(yī)个菜谱。”这就是情景(jǐng)人(rén)工智能。
人工智能(néng)对(duì)话之后(hòu)的下一(yī)个阶段很可能是完全感知,虚拟助(zhù)手,无论是智能(néng)扬声器还是(shì)智能手表,都可以像人类一样(yàng)与用户交流。Damianos介(jiè)绍,完全(quán)的意(yì)识是概念性的,并带有问号。“我们还不知道时间轴,但可能会在人工智能对话之后(hòu)的5到6年(nián)。这将(jiāng)取决于人工智能的发展和该(gāi)领域(yù)公司的(de)发展。
虽然这(zhè)些一直监听(tīng)的系(xì)统可以在汽车人机界面中挽救生命,但(dàn)它们也引起了人们对用户隐私(sī)保护的担忧。为了防止可能的误用(yòng),Debray强调,数据(jù)处理应该尽可能快地进行(háng),并(bìng)尽可能(néng)靠(kào)近(jìn)麦克风。“离麦克风越近(jìn),隐私(sī)泄(xiè)露的可能(néng)性就越小(xiǎo)。”
隐(yǐn)私包含多个维度,因为用(yòng)户(hù)可能希望隐藏自己的性别、年龄或(huò)情绪(xù)。展望未来,Debray表示,他有(yǒu)信心(xīn)麦克风、ASIC或应用处理器领域的参与者将开发(fā)出确保用(yòng)户隐私的技(jì)术。麦(mài)克风可以(yǐ)消除声音中(zhōng)的情绪,只呈现音频数据。
Yole分析师预计,GAFAM将(jiāng)继续占据主导地(dì)位(wèi),因为目前它们(men)对分析的作(zuò)用至(zhì)关(guān)重要,但传感(gǎn)器制造商显然(rán)渴望在边缘加入人工(gōng)智能,并将音频分析业务从云端分流出去。Damianos:“传感器制造商(shāng)希望增加他们的收(shōu)入,并从音(yīn)频市场中分(fèn)一杯(bēi)羹。这不是一场来(lái)自(zì)大公司一方的战斗。这是传感器公司的一场战斗。”
Alexis Debray:“传感器公司确实在追求(qiú)多(duō)样化的战略,“试图向价值(zhí)链(liàn)移动,变得更(gèng)加一体化。”
在最近的一次采访(fǎng)中(zhōng),Vesper Technologies Inc.首席(xí)执(zhí)行长(zhǎng)Matt Crowley曾表示,Vesper正在(zài)寻求提高(gāo)其压电MEMS麦克风的智能(néng)化程度。“我们相(xiàng)信,在未来,我(wǒ)们将在传感器中嵌入一些(xiē)与人(rén)工(gōng)智能配对的传感器。它将(jiāng)能够(gòu)学习人类(lèi)和(hé)动物(wù)如(rú)何使用他们的感官——不仅仅(jǐn)是视觉(jiào)、听觉、味觉、嗅觉和触觉,还有动作或温(wēn)度——来了(le)解他们的环境(jìng)。我们的长期(qī)愿景是,这些物体将(jiāng)使用多(duō)种(zhǒng)仿生传(chuán)感器来了解它们(men)的环境,并尽可能做出最(zuì)佳反(fǎn)应。”
此外,英飞凌(Infineon AG)也改变了(le)自己的商业模式,从销(xiāo)售麦克风模类产(chǎn)品转向(xiàng)销售Goertek和AAC等公司的产品,再到(dào)销售(shòu)成套的MEMS麦克风(fēng)。从(cóng)一(yī)个MEMS麦克风(fēng)制造(zào)商到一个做(zuò)制造(zào)、封(fēng)装、测(cè)试和销售的(de)综(zōng)合播放器。“这是战略(luè)上的变化……这(zhè)可能意(yì)味着,他们看到了VPA的(de)动向,希望在这个市场上找到自己的定位。”
同样(yàng),美国楼氏(shì)电子Knowles,今天的领(lǐng)导(dǎo)者(zhě),拥有MEMS麦(mài)克(kè)风市场39%的份额,最近从Ams AG收购了MEMS麦克风ASIC设计部(bù)门。这(zhè)是引入混合(hé)信号电路设计知识产(chǎn)权的一(yī)种(zhǒng)方式,同时也是应对来(lái)自(zì)中国公司如Goertek和AAC日益(yì)激烈的竞争的一种方式(shì)。
MEMS麦克(kè)风为音质(zhì)提供有(yǒu)力支持
全(quán)球音(yīn)频(pín)市(shì)场继(jì)续其增长轨迹。基(jī)于语音的VPA需要(yào)更好的(de)信噪比(SNR),以便在嘈杂的环境中准确地捕捉人的声音,因此MEMS麦克风面临着新(xīn)的市场(chǎng)机遇。
据Yole称(chēng),全球麦克风(fēng)、麦(mài)克风和音频芯片消费市场(chǎng)的年(nián)化增长(zhǎng)率(lǜ)将达(dá)到6.6%,从2018年的141亿美元增(zēng)长(zhǎng)到2024年的208亿美元。便宜,小巧(qiǎo),易于集成,麦克风被(bèi)广泛采用,并达(dá)到很高(gāo)的音量。Damianos:“我们使用了大(dà)约60亿(yì)个麦克(kè)风,”目前麦克(kè)风(fēng)市场(chǎng)规模为17亿美(měi)元,预计到2024年,其复(fù)合(hé)年增长率将达到(dào)3%,达到20亿(yì)美元。
MEMS麦(mài)克风市(shì)场目前约占总市场的70%,将从2018年的12亿美元增长到2024年的16亿美元。主要的(de)驱动(dòng)市场包括(kuò)智(zhì)能(néng)手机、智能(néng)音箱(xiāng)以(yǐ)及可听设备(如无线耳机)。Damianos 介(jiè)绍:“在过去(qù)的几年里(lǐ),智能(néng)音箱和可(kě)听(tīng)设(shè)备的市场经历了(le)爆炸性的(de)增长(zhǎng)。到2024年,智能音(yīn)箱中的MEMS麦克(kè)风的复合年增长率将(jiāng)达(dá)到13%,达(dá)到12亿只(zhī)。到2024年,无线耳机的复合年增长率将达到29%,达到13亿(yì)部。
2019年(nián)智能(néng)手机用户(hù)20%的人机(jī)互动(dòng)将使用语音助(zhù)理
各大手(shǒu)机平台也在积极投入,让虚拟个人(rén)语音助理(VPA)的功能(néng)日益强大(dà),甚(shèn)至连苹果Siri都会(huì)唱(chàng)PPAP,研究机构(gòu)Gartner表(biǎo)示,相关技术进展将促使用户更常使(shǐ)用VPA,预计到2019年,智能型手机用户20%的人机互(hù)动,都将(jiāng)使(shǐ)用VPA。
Gartner还公布(bù)了2016年第(dì)四(sì)季(jì)的行动应用调查,在中国、英国与美(měi)国调查了(le)3021名手机用户,发现美国有42%、英国有32%用户(hù)在(zài)过去(qù)三个月内(nèi)使用过VPA功能,英美平均每天至少使用一次的用户达37%。
有54%受访(fǎng)的(de)英美(měi)用户(hù)过去三(sān)个月使用过苹果(guǒ)的Siri,Google Now的过去三个月使用率(lǜ)在美国则为48%、英国41%。Gartner表示(shì),随(suí)着更多新功能的出现、更多语系支持,以及越来越(yuè)多机种支持VPA,这类接口的使用率将(jiāng)会逐步成长。
Gartner表示,VPA的成长(zhǎng),会(huì)和同时间快速发展的「会话商(shāng)务(conversaTIonal commerce)」相(xiàng)互加持(chí),且(qiě)不仅是(shì)语音识别(bié)为中心,通讯软件语对话功能亦将扮演重要(yào)角色(sè),例如Facebook Messenger的新商务功能(néng)便(biàn)可让用户透过对话(huà)订购(gòu)商品、呼叫Uber等(děng),此外,腾讯的微信发展出的支付(fù)功能也已经成为该通讯(xùn)服(fú)务的重要功(gōng)能。
Gartner表示,中国是目前(qián)全球会话商务最成熟的市(shì)场,以通讯平台为核心(xīn)的市场发(fā)展状况已经(jīng)促使传统商业(yè)进行(háng)变革。微软的(de)Cortana也正整合入Skype,Cortana则负(fù)责扮演第三方服(fú)务提供商与消(xiāo)费者之间、以对话呈现的(de)互动平台,协助用户(hù)进行机票、饭(fàn)店预订等商务活(huó)动(dòng)。
除了语音(yīn),Gartner亦预测现在是移动电话主流互动接口的触控(kòng)功能(néng),将不再是消(xiāo)费(fèi)者唯一仰赖的接口,语音语动作(zuò)(gesture)的重要性将会在(zài)消费性装置上大增,预期到2020年(nián)将有70亿台个人设备、13亿(yì)个穿戴式装(zhuāng)置与(yǔ)57亿个其他类消费性物联网终端装置,将会(huì)仅有基本,或完(wán)全没(méi)有触控设计(Zero-Touch UI),使用传感器针对周边环境进行情境信息搜集,如语音、环境、生物(wù)特征、移动与动作(zuò)等(děng)信息,将会成(chéng)为新型态UI的重(chóng)要(yào)设计依据。
与此同时,目前(qián)价值(zhí)91亿美元的微型扬声器(qì)市场,预计在2024年将以3%的复合年增长率达(dá)到109亿美元。
但(dàn)在2018年(nián)到2019年,智能手(shǒu)机市场放缓(huǎn),可能是因(yīn)为智能手机越来越贵,手机(jī)硬件越来(lái)越好,使用寿命增加(jiā),用户在升级之前等(děng)待的时间更长。以前(qián)你(nǐ)每1.5年换一(yī)次手机,现在是每2.5年换一次,而(ér)且还在增加(jiā), 我(wǒ)们预计麦(mài)克风和微型扬声器市场将(jiāng)会下滑(huá)。事实上,可听设备和智能音箱的爆炸式增长抵消了这种差异。VPA正在推动所有这些设备中麦克风(fēng)和扬(yáng)声器的集成化(huà)。