九游网页版-九游(中国)



  • 咨询热(rè)线(xiàn):021-80392549

    九游网页版-九游(中国) QQ在(zài)线(xiàn) 九游网页版-九游(中国) 企业(yè)微信
    九游网页版-九游(中国)
    九游网页版-九游(中国) 资讯 > 人(rén)工智能 > 正文

    三大(dà)“黑科技”加(jiā)身(shēn),探境科技(jì)AI语音芯片出货达百万级

    2019/12/30217

    IDC 预计,2019 年全球(qiú)智(zhì)能(néng)家居设(shè)备市场出货量将达到 8.327 亿台(tái),将同比增长 26.9%。蛋糕之大让业界一片欢腾,尤(yóu)其(qí)是(shì)进入(rù)门槛(kǎn)较低的语音(yīn)识别应用(yòng)市场,吸引了(le)众多 AI 创(chuàng)业公司的目光,市面上出现了多款针对语音识别(bié)的 AI 芯片(piàn),其(qí)中不乏思(sī)必驰、云之声等(děng)算法厂商(shāng),还有出门问问、若琪等终端厂(chǎng)商,语音 AI 芯片市场的(de)竞争变得异(yì)常(cháng)激烈。

    近(jìn)期,探境科技也推出了具有 AI 双麦(mài)降噪功能的语音识别方案,即 Voitist 音(yīn)旋风 612。可能很(hěn)多(duō)人对探境科技(jì)并不是熟悉(xī),其(qí)实这并不是一(yī)家新的 AI 公司,而是在 2017 年就(jiù)已经成立(lì),只(zhī)是公司初期在埋头研发(fā),因(yīn)此很少(shǎo)出现在公众的视野中。据其技(jì)术(shù)副总裁(cái)李同治(zhì)介绍,“公司创始人鲁勇(yǒng)曾经在(zài)全球著(zhe)名半(bàn)导体公司 Marvell 担任研发(fā)高(gāo)管,研(yán)发团队有(yǒu)着给(gěi)苹(píng)果、三星、希捷(jié)、西数、特斯拉等(děng)国际顶级公司量产芯片供货的经验,公司的目标是为客户(hù)提(tí)供终端(duān)人工(gōng)智能芯片及(jí)整(zhěng)体解决方案。如今,公司在(zài)北京(jīng)、上海(hǎi)、深圳、杭州、合肥(féi)及美国硅谷都设立(lì)了研(yán)发基地,目前公司员工近(jìn) 200 人,其中技术(shù)研发人(rén)员 150 人,平均研发经验在 15 年以(yǐ)上。”

    在(zài)今年的(de) 7 月(yuè)份(fèn),探境(jìng)科技就推出了(le)首款 AI 语音识别芯片音旋风 611,并且已经量产(chǎn),李同治介绍(shào),“音旋风(fēng) 611 支持多达 200 条命令词,能够覆盖家庭生活场景中几乎所有常见(jiàn)的语音控制(zhì)命令(lìng);在识别率方面(miàn),不低于(yú) 99%的唤醒率,超过 97%的识(shí)别率(lǜ),以及低于 24 小时(shí) 1 次的误唤醒(xǐng)率。适用于各种需要语音进(jìn)行控制的应用场景,芯(xīn)片内嵌(qiàn)领先(xiān)的 NPU 架构,配合单麦克风即可实现(xiàn) 5-10m 远距(jù)离(lí)的语音识别,识别延(yán)迟小于 0.2 秒,不需(xū)要依(yī)赖云和网络,可(kě)在本地完成推理运算,音旋风 612 是 611 的升(shēng)级版。”

    AI 公(gōng)司以技术取胜才能走得更远,探境科技能够推(tuī)出(chū)这样的产品也全依赖于技术驱(qū)动。AI 应用(yòng)需要软件和硬件共同实现,市面上的很(hěn)多公司要么单独做算法,要么单独做硬件,这(zhè)就容易出现软件和硬件匹配(pèi)困难的问题,探境科技是在软(ruǎn)件和硬件两方面(miàn)同时研发,从而(ér)实现软硬件融合,包(bāo)括芯片设计、结构框(kuàng)架、系统、算法等全部自主研发。在发布(bù)会(huì)上,探境科技负责人从硬件(jiàn)方面介(jiè)绍了公(gōng)司的(de)独特技术(shù)存储(chǔ)优先(xiān)架构,从软件(jiàn)方面分析了公司(sī)的三大黑科技。

    杀手锏:存储优先架构

    传(chuán)统的处理器一(yī)般都采用冯·诺(nuò)伊曼体(tǐ)系结构,计算单元(yuán)和存储单元相互(hù)独立(lì),每次(cì)运算(suàn)计算单元(yuán)将数据从存储单元(yuán)中提(tí)取出来,处(chù)理完成后再写回(huí)存(cún)储单元中。近年(nián)来,处理器(qì)性(xìng)能飞(fēi)速提升,但是(shì)访问(wèn)存储器的速度(dù)并(bìng)没有(yǒu)相应的(de)提升,所(suǒ)以访(fǎng)问存储器的(de)速(sù)度无法(fǎ)跟(gēn)上(shàng)处(chù)理器消耗数(shù)据(jù)的速度(dù),导致处理器的计算性能无法充分发挥出来,这就出现“存(cún)储(chǔ)墙”问题(tí)。

    为了解决“存储(chǔ)墙”问题,探(tàn)境科技推(tuī)出了存储优先架构(即SFA架构),这是(shì)一种不(bú)同的技术路线。探境科技(jì)创始人(rén)鲁勇解释,所有(yǒu)深度学习算法和(hé) AI 芯片(piàn)都面(miàn)临一个问题,它们并不(bú)是要做卷积运算的(de)乘法(fǎ)或加法,这并(bìng)不是(shì)最难(nán)解(jiě)决的问题,难点是在于(yú)有很多数据在重复(fù)使(shǐ)用,数(shù)据在存储(chǔ)器里的(de)位(wèi)置、相对关系(xì)、读取的(de)性能会影响到(dào)算法运(yùn)行的性能(néng)。而且数据的存(cún)储带宽要求很大,存储功耗很高。传统上的解决(jué)方式(shì)不考虑存储墙的问题,暴力增加(jiā)存储(chǔ)单元,成本(běn)很高。我们用一种独(dú)特的(de)芯片(piàn)架构来(lái)推翻(fān)冯(féng)诺依(yī)曼体系架构,把数据读取的次数降低,降(jiàng)低数据的(de)冗余,从而降低带宽(kuān)的需求(qiú),通过算法和调(diào)度数(shù)据的方式,改进数据管理,在(zài)硬件(jiàn)上控制(zhì)数(shù)据流,降低数据重复使(shǐ)用,通过软件和硬(yìng)件结合,在芯片上降低(dī)资源的链(liàn)接(jiē)复杂(zá)度(dù),这种架构(gòu)我们(men)称为存储优先架构,其实我们(men)改善的是芯片本身的原因。”

    portant;" />

    从效果来看,鲁勇强(qiáng)调,“这种方法可以带来超高的能(néng)效比,数据访问可降低 10-100 倍,存储子系统(tǒng)功耗下降 10 倍(bèi)以上,28nm 工艺系统(tǒng)能效(xiào)超(chāo)过 4T Ops/W。”

    鲁勇将 SFA 架构称(chēng)为真正符合商业应用的 AI 芯(xīn)片架构(gòu),因为其采用成熟的设计方(fāng)案(àn),无需对底层(céng)器(qì)件进行修改设(shè)计,可以走商(shāng)业化路(lù)径(jìng);通(tōng)用性高(gāo),芯片面(miàn)向的(de)场景众(zhòng)多,必须支(zhī)持多种算法才可以被(bèi)商业化;同时易用性高,用(yòng)户学(xué)习成(chéng)本低,模型移植简单。

    需(xū)要指(zhǐ)出的是,一般 AI 芯片只针对某(mǒu)一神经网络进行运算,SFA 架构支持任何神经网(wǎng)络,而(ér)且可(kě)以调整参数。

    存储(chǔ)优先算法既(jì)然如(rú)此高效,为什么(me)其它(tā) AI 公司没有开发?鲁勇(yǒng)的解释(shì)是,这是一项(xiàng)有(yǒu)技术门槛的技(jì)术,不仅在技(jì)术上(shàng)需要要懂数(shù)学原理、架构、数据管理(lǐ)知识,同时需(xū)要有(yǒu)丰富的芯片设计经验,综合起来(lái)才能做(zuò)到高效(xiào)率,这些都是探境(jìng)科技(jì)所具备的(de)。

    如果说存储(chǔ)优先(xiān)架构是探境科技在硬件上实现的(de)优化(huà),软件上(shàng)又做了哪些工作?李(lǐ)同治向我(wǒ)们做了(le)详细介(jiè)绍。

    三大黑科技加(jiā)身(shēn),出货量过百万

    李同治将探境科技(jì)在软(ruǎn)件上的创新归结为三大(dà)“黑科技”,分别是 AI 降噪(zào)算法、高计算强(qiáng)度神经(jīng)网络 HONN、基于 FCSP 的端到(dào)端 AI 双麦算法。

    黑科技之一:AI降噪算法

    目前在智能家居应用中(zhōng),语音识别面(miàn)临环境噪杂或者距离远,从而导致识别不(bú)清(qīng)的难题(tí),智能家居设备厂家急需一(yī)种能够准(zhǔn)确过滤(lǜ)噪音,并提取目标声源(yuán)的(de)方案(àn)。

    portant;" />

    在语音识别技术中,信噪比是衡量识别的目标声源(yuán)与其它(tā)干扰声源强度比值的(de)对数。一般将信(xìn)噪比低于(yú) 15dB 的称(chēng)为噪声环(huán)境(jìng)。信(xìn)噪比越低,识(shí)别(bié)难度越大。在语音(yīn)识别的研发过程(chéng)中,一(yī)个完整的识别链路可以(yǐ)简化(huà)为麦克风输入(rù)、降噪(zào)处理、语音识别、识别结果(guǒ)输入四个环节(jiē)。想做好识别(bié),首先要在降噪处理(lǐ)上下(xià)功夫。

    探(tàn)境科技自研了(le) AI 降噪算法基于深度学习,不仅(jǐn)能(néng)够处理稳态的(de)噪声,非稳态(tài)的突发性噪声也能(néng)快速过滤。为了验证探境 AI 降噪算(suàn)法的有效性(xìng),技术人(rén)员(yuán)将一批信噪比在 3dB 左右的语(yǔ)音(yīn)数据送(sòng)到一个知名的云端公开语音识别引擎做(zuò)了测试,降噪后比降(jiàng)噪前(qián)提高 30%识别准确(què)率。

    黑(hēi)科技之二:高计算强(qiáng)度(dù)神经网络HONN

    在对声音进(jìn)行降噪(zào)处理之后,就进入到(dào)了语(yǔ)音识别环节。在这一环节中,神经(jīng)网络模型(xíng)所需的(de)算力决定了模型(xíng)的描述(shù)能力,同时也决定了(le)模型(xíng)处理能(néng)力(lì)和识别率(lǜ)的上限。在(zài)传(chuán)统(tǒng)的语音识别算法(fǎ)里,国内很(hěn)多语音识别芯片都采用(yòng)了全连接(jiē)操作(zuò) DNN 技术。但是相对全连接操(cāo)作,卷积操(cāo)作能够提供更高的计算强度(dù),且卷积运算与人类大脑负责感知模块(kuài)的处理方(fāng)法类似,能够提取满(mǎn)足大脑认知(zhī)的(de)本质特征。

    探境将其计算机视觉中的一些经验迁移到语音识别中,在语(yǔ)音识别算(suàn)法上加入了(le)更多的卷积操作,重新设计了(le)一个高计算强度的神经网络,即 HONN(High Operation Neural Network)。

    portant;" />

    李同(tóng)治解释,“对比发(fā)现(xiàn),HONN 仅需要 350k 的(de)存储空间(jiān),而 DNN 需要 1.6M 的存储空间,更低的存储(chǔ)需求意味着(zhe)成(chéng)本(běn)更低(dī)。同时 DNN 与 HONN 所需的(de)算力相反,处理高强度模型单帧时,HONN 需(xū)要超过几百兆 OPS,而(ér)一般的 DNN 模型仅为个位数的算力,两者相(xiàng)差超(chāo)过 30 倍(bèi)。对于(yú)神经网络来说(shuō),模型所需的算力决定了模型识别(bié)率的上(shàng)限。相对安静的(de)环境下两者(zhě)之间差别不大,但(dàn)是当信噪(zào)比(bǐ)进一步降低时,基于 HONN 的(de)方法(fǎ)识别优势非常明显。”

    在实际测试中,在抽油烟机的(de)噪音中(大约 70 分贝),HONN 方式下的识别信噪比约(yuē)为 3~5dB,单灯模型的识别效果非(fēi)常准确。

    黑科技之三:基(jī)于FCSP的端到端AI双麦算法

    信噪(zào)比(bǐ)还(hái)有(yǒu)一种更严苛的情况,就是 0dB 和负(fù) dB,0dB 意味(wèi)着(zhe)噪声和信(xìn)号强度(dù)一样,甚至噪声比(bǐ)语音信(xìn)号还要(yào)强,面对(duì)这种(zhǒng)应用场(chǎng)景,探境(jìng)科技采用了基于 FCSP 的(de)端到端 AI 双麦算法。

    portant;" />

    传统的麦克风阵列处理算法有(yǒu)几大缺点,从(cóng)而造成(chéng)处(chù)理(lǐ)效果并不理想(xiǎng)。“为了克服(fú)传统处理方(fāng)式(shì)的缺点,我们设计出了基于 FCSP 的端到端 AI 双麦算法。”李(lǐ)同治对记者表示“FCSP(Frequency Complex Subspace Projection)是我们自研的频域复(fù)数子空间投影算法的简(jiǎn)称,这个(gè)算法直接输入阵列(liè)信号,输出的是最终的识别结果,中间部(bù)分(fèn)全(quán)部交(jiāo)给基于深度(dù)学习的 AI 算法来处理,不再使用传统的数字信号处理方(fāng)法。信号增强与识别模块整(zhěng)体以降低(dī)识别(bié)错(cuò)误率(lǜ)为目标(biāo)进行优化(huà),避免了语音增(zēng)强(qiáng)与语音(yīn)识别模块错配(pèi)的问题。”

    另外,在(zài)模型训练期间(jiān),采取了“注意力增强”的学习方法,能够灵敏的检测到唤醒词和命令词,即(jí)使干扰信号与目标信号方向接近(jìn),也能灵(líng)敏的进行唤醒和识别。李同治做了一(yī)个形象的比喻,“这个类似于(yú)在一个嘈杂的(de)环(huán)境里面,如果有人喊自己的名字(zì),一下子就能(néng)反应过来。”

    李同(tóng)治强调,“我们采取了频域复数子空间投影,抗噪性能强,在(zài)信噪比为 0dB 时,相对于(yú)传统的处理算法,相(xiàng)对识别错误率降低超过 20%。”

    通(tōng)过 AI 语音算法+HONN 神(shén)经(jīng)网络(luò)模型来提升(shēng)识别率,再(zài)通(tōng)过(guò) FCSP“端(duān)到端”的双麦处理算法简(jiǎn)化识别流程,降低最终(zhōng)识别错误率(lǜ),探境的语音算法实现(xiàn)了跨越式的升级,加(jiā)上通过存储优先架(jià)构(gòu)打造的 AI 芯片(piàn),探境科技可以为(wéi)客(kè)户(hù)提供芯片、算法俱(jù)全的 Turn-key 方案。

    除了支持(chí) AI 双(shuāng)麦的 Voitist 音(yīn)旋风 612 之外,还(hái)包括在离(lí)线一体的 Voitist 音旋(xuán)风 621、以及(jí)语音(yīn)芯片的旗舰产品——可支(zhī)持本(běn)地 NLP 的音(yīn)旋风 7 系列。探境目前拥有约 30 家合作伙伴(bàn),既有美的、海尔(ěr)等智能家(jiā)居制造大厂(chǎng),也有世(shì)强(qiáng)科技在垂直领(lǐng)域颇具(jù)影响力(lì)的渠(qú)道商,知名智能家居制造商(shāng)阿凡达智控也刚(gāng)刚与(yǔ)探境(jìng)达成(chéng)合作,目前(qián),探境科技的产品出货量已达百万级别(bié)。

    未来规划:从语(yǔ)音(yīn)到图像,离(lí)线在线一体方案已(yǐ)在路上

    近两年(nián),边缘(yuán)计算大热(rè),随着(zhe)数据量不断增(zēng)大,云端(duān)的承载(zǎi)压(yā)力越来越大,因此终端客(kè)户寻求在边缘完成部分数据处理,从而分担(dān)云端的压力。尤其在 AI 领域,未来对(duì)延迟和带宽提出(chū)更苛刻(kè)的要(yào)求,探境科技(jì)也认为,真正的人工(gōng)智能应用场景,是不需要借(jiè)助云端服务等做(zuò)远(yuǎn)程支持的(de),只有(yǒu)将人工(gōng)智能做到终端上来,让每个设备(bèi)都具备人(rén)工智能,才是现阶段“人工智(zhì)能”的进化。

    portant;" />

    目前厂商多采用在线方案,就(jiù)是打(dǎ)一(yī)个数据包放到云(yún)端,而离线方案是语音识别算法在本地,音乐等播放内容还是放(fàng)在云端。据鲁勇透露,未来探境还会将语音产品进行二次(cì)升级,推(tuī)出更多在线离线一体化方(fāng)案。探境科技采用 HONN 神经网络模型,意味着处理模型(xíng)变小,放在边缘(yuán)的存储容量(liàng)变小,成本也(yě)随之降(jiàng)低。关于用户对在线方案和离(lí)在线一起方案的选(xuǎn)择,鲁勇表示,离线在线一体方案和在线(xiàn)方案两(liǎng)种会共(gòng)存(cún),毕竟用户的想法不同,选(xuǎn)择也不同。

    portant;" />

    关于产品(pǐn)规划,鲁勇还(hái)表示,“探境(jìng)不仅仅是一个语(yǔ)音芯片公(gōng)司,而是一家语音、图(tú)像整体结合的 AI 芯片(piàn)公司。除了语言市场之(zhī)外,我们还(hái)看好(hǎo)工业视觉、新零售、安防、辅助驾驶等市(shì)场。我们的图像芯(xīn)片在(zài) 2019 年 Q4 就已经流片成功,在某些应用中已经开始(shǐ)产生营收。AI 芯(xīn)片的蛋(dàn)糕非常大,探境希望可以联合上下游一起,开发(fā)生态,开放 SDK 和工具链,不(bú)仅是大家可(kě)以直接(jiē)使用我们的产品,我们也希望有大量的(de)合作伙伴(bàn),完成更多的场景(jǐng)开发。”

    鲁勇认为,AI 芯(xīn)片这一领域不像(xiàng)手机 APP 那样(yàng),瞬间(jiān)可以凭一款应(yīng)用获得(dé)数百万的用户,AI 芯片更像马(mǎ)拉松长跑,比的(de)是耐力(lì),而不是冲(chōng)刺速度,在(zài)这场比赛中,不是要看谁(shuí)跑得(dé)快,而(ér)是要看谁有潜力到(dào)达(dá)终点,谁在(zài)中途不走岔路。探境作为创业公司,虽然进入市场比较晚(wǎn),但是这也是(shì)一个拐点期(qī),市(shì)场教育工作已经(jīng)完成,后面市场竞争还(hái)是看核(hé)心技(jì)术,我(wǒ)们的优(yōu)势在于软件(jiàn)和硬件都(dōu)自主研发,因此算(suàn)法移植非常快,我们将从智能家(jiā)居领域开始,先打好(hǎo)地基,再(zài)逐渐加码,等(děng)待市场大潮的(de)到来。

    关(guān)键词:




    AI人工智(zhì)能(néng)网(wǎng)声明:

    凡(fán)资讯(xùn)来(lái)源注明为其他媒体来源的信息,均为转载自其他媒体,并不(bú)代(dài)表本网站(zhàn)赞同其观点,也(yě)不代表(biǎo)本网站对(duì)其真(zhēn)实性负(fù)责。您若对该文章内容有任何疑问或质疑,请立即与(yǔ)网站(zhàn)(www.zhiguan.chaozhou.14842.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本网(wǎng)站将迅速给(gěi)您回应并做处理(lǐ)。


    联(lián)系电(diàn)话:021-31666777   新闻(wén)、技术文章投稿(gǎo)QQ:3267146135   投稿邮箱(xiāng):syy@gongboshi.com

    精选资(zī)讯更多

    相(xiàng)关资讯更多

    热(rè)门搜索

    工博士人工智能网
    九游网页版-九游(中国)
    扫描二维(wéi)码关注微信
    扫(sǎo)码反(fǎn)馈

    扫一扫,反馈当前页面

    咨询反馈(kuì)
    扫码关注

    微信公(gōng)众号

    返回顶(dǐng)部

    九游网页版-九游(中国)

    九游网页版-九游(中国)