由声智(zhì)科技(jì)研发的“AI数(shù)字人垃圾分类管家”融合了(le)人脸识别、智能语音(yīn)交互(hù)、行为识别(bié)等技术,使垃圾分类管(guǎn)理更加方便快速。
一台可以书写的(de)智能交互机(jī)械臂,用毛笔写下“一起向未来”;一部多足(zú)行走机器人和一部跳舞机器人,共同跳起了一段舞(wǔ)蹈,随后,跳舞机器人还单独进(jìn)行了一(yī)段武术表演,抱拳开臂,马步弓步,一(yī)招一(yī)式憨(hān)态可(kě)掬。这是记者在北京声智科技有(yǒu)限公司(以下称“声(shēng)智科技”)展厅里看到的景象(xiàng)。
声智科(kē)技成立于2016年,专注于声学前(qián)沿(yán)技术和人工智(zhì)能领域,主要面(miàn)向数智(zhì)健康(kāng)、数智城市等场(chǎng)景提(tí)供产品和解决方案(àn)。凭借持续创新研发(fā),声(shēng)智科技获得了吴文俊人工智能科学技(jì)术奖、北京市科技进步二等(děng)奖等多个(gè)奖项。
突破技术难点
“声智(zhì)科技是从研发远(yuǎn)场语音交互技术起步的,你刚才(cái)看到的那(nà)几个智能机(jī)器人搭载了声智科技研发的智能语音交互技术。”声智科(kē)技创始人陈孝良说,随着物联(lián)网(wǎng)技术(shù)的普及,语音成为(wéi)人机(jī)交互(hù)的新入口,支持远场语音交互的(de)产品市场潜力很(hěn)大。
“远(yuǎn)场(chǎng)语音识别技术面临诸多研发难点,比如(rú)环境噪声(shēng)、人声(shēng)、房间混响的干扰等。若(ruò)采用常规语音(yīn)处理方(fāng)法(fǎ),会导致信号失真和(hé)资源消耗大,使得语音识别技术准确率低,应用困(kùn)难。”陈孝良说。
凭借深厚技术积(jī)累和持(chí)续研发(fā),声智科技先后攻克了多项远场语音交互关键技术(shù),包括(kuò)回声抵消技术(shù)、噪声消(xiāo)除技(jì)术、声源定位技术、语音识别技术(shù)等。如今,这些技(jì)术(shù)已应用于一(yī)些消费级电子产品中,声智科技也成(chéng)为国内不少知名企业的合作伙伴。
“我们(men)意识(shí)到,伴随着人(rén)工智(zhì)能的快速发展,人机交互、协同过程中的多数问题,都不能靠(kào)单一技术解决(jué),需(xū)要将(jiāng)语音、图像识别、大数据等技术结合起来。只有推进多(duō)模(mó)态、多(duō)技(jì)能的融合,才能实现更多场景的应用。”声智科技副总裁李(lǐ)良斌说。
他介(jiè)绍,声智科技(jì)的做(zuò)法是,用“多模(mó)态(tài)”确保机器具有“声、光、电、热(rè)、力(lì)、磁”多种感(gǎn)知技术;用“远场”解决(jué)机器在远距离场(chǎng)域中对多模态(tài)信号的分析;用“多技能”赋(fù)予智(zhì)能系统多(duō)种(zhǒng)能力,通过多技能(néng)相互协同,完(wán)成复杂任(rèn)务。
基于这种技(jì)术理念,声智科技研发推(tuī)出核心技术产(chǎn)品——壹元人工智能开发框架。基于这个框架(jià),声智科技融合了远场声光、多模态识别(bié)等多项(xiàng)技术,围绕智慧社区、智慧交通、智慧办公、智慧医院等应用场景,提供(gòng)AI产品及解决(jué)方(fāng)案。
截至目(mù)前,声智科技已经(jīng)参(cān)与了50余项国家行业(yè)标准的(de)制定,拥有国内专利2000余项(xiàng)。在2020年(nián)前(qián),声智(zhì)科(kē)技总融资(zī)金额超过(guò)3亿元。陈孝良说(shuō),这些融资全部投入到核心技术的持续研(yán)发(fā)上。
助力(lì)智(zhì)慧防疫
新(xīn)冠肺炎疫情暴发(fā)以来,声智科技自主研发的技术(shù)产品,用于多地的(de)防疫服务中。
记者刚走进中(zhōng)关村前沿技术创新中心(xīn)的一楼(lóu)大厅,就听到清脆的声音(yīn):“您现在的体温是36.5摄氏度(dù),没有发热症状”。声音来(lái)自一台测温机器人,在机器人显示屏上,除了实时显示被检测者的红外热成像信息和温度值,还能查看全国疫情数(shù)据,测温精度(dù)在(zài)正负0.2摄氏度。
声智(zhì)科技首(shǒu)席知识官常乐介(jiè)绍,这(zhè)个测温机器人可在几秒钟内(nèi)完成1米至6米范围内多个目标的高精度测温,支持实(shí)时AI语音(yīn)合成播报,自动上传预警信息。目(mù)前,该机器人已(yǐ)在北京、广州、青岛、成(chéng)都等地落地使用(yòng)。
“小(xiǎo)易小易,上楼”“小易小易,去(qù)10楼”,在北京海淀医院的电梯里,只需(xū)要(yào)一句简单的指令(lìng),就(jiù)能实现乘(chéng)梯上下楼,全程免按(àn)键,实现零接触。
“声智科(kē)技研发的智慧(huì)语音电梯,融(róng)合语(yǔ)音与图像等交互技术,不依赖(lài)手(shǒu)机、IC卡等(děng)设(shè)备,无论使用者(zhě)是在电(diàn)梯外,还是在电梯轿厢内,都(dōu)可以通过可视化(huà)人机交互方式搭乘电梯(tī)。”常乐介绍,这方便了老人、儿童等用户的(de)日常生(shēng)活,在(zài)疫情防控期间还(hái)有效降(jiàng)低了(le)接触传播感染风险。
目前,声智科(kē)技已推出第(dì)二代(dài)AI智能电梯系统(tǒng),增(zēng)加手势识别功能,残障人士(shì)也可以实(shí)现免(miǎn)接触控制电梯。2021年,为解决电动自行车入户充电的监管难题,减(jiǎn)少电池充电爆炸(zhà)起火等隐患,企业又迭代推出了第三代AI智(zhì)能电梯。
“未来(lái),我们希望AI技术能满足复(fù)杂场景的灵(líng)活、大范围应用(yòng)。”李良斌表示,声智科技将继续加强核心技术研发,让(ràng)更(gèng)多AI产品落(luò)地(dì),使万物互联更智能。