11月8日,猎豹移动(dòng)董(dǒng)事(shì)长兼(jiān) CEO 傅盛出席(xí)第五届世(shì)界互联(lián)网大会“物联网:连接无处(chù)不在(zài)”论坛(tán),并发表题为(wéi)《真开放·全链条AI技术赋能物联网(wǎng)》的主题(tí)演(yǎn)讲。
猎豹移动董(dǒng)事长(zhǎng)兼CEO傅盛
傅盛表示,即(jí)便是在今天的生产线(xiàn)上,也(yě)很难解决设备智能化的问题,而AI让机(jī)器(qì)第一次拥有(yǒu)了人类(lèi)的感知能力(lì),也让物联网终端更聪明(míng)。这是一个(gè)巨大的分(fèn)水(shuǐ)岭,使得AIoT的概念开始出现。在行业(yè)和自身的变革背景下,猎豹移动携(xié)旗下人(rén)工智能公司猎户星空,研发(fā)了包括语音识别、视觉(jiào)识(shí)别、室内导(dǎo)航(háng)平台等在内的行业唯一全链条AI技术。
他说到(dào),“我们未来不会单做一款硬件,我们(men)致力于打造AI赋能(néng)的云(yún)端操作系统,跟(gēn)开发者一起做更多的物联网设备(bèi)。”
以下是(shì)演讲全文:
首先(xiān),我花一点(diǎn)时间介绍一下(xià)猎(liè)豹移(yí)动。猎(liè)豹移动是一(yī)家经历过(guò)三次跨越(yuè)的公司,2010年由我(wǒ)自己创办的可牛(niú)影像和(hé)金山安全合并而成(chéng)。
当(dāng)时(shí)我们经历的第一波(bō)是PC杀毒软件(jiàn)免(miǎn)费化,实现(xiàn)了第一次的增长(zhǎng)。
第二波在移动互(hù)联网的时(shí)候,我们碰到了强大的对(duì)手,决定出海。我们是第一(yī)家大规模的把(bǎ)用户做到(dào)海外的中国公司。今天,猎(liè)豹移动大概(gài)有5亿(yì)多的月度活跃(yuè)用户,其中80%来自于海外(wài),完全走出了一条不一样的曲(qǔ)线,我们内部叫做“天(tiān)外飞仙”。所以我们现在依然是Google工具排(pái)行榜的(de)第一,我们(men)游戏的下载次数在全球接(jiē)近20亿次。
第三波是在2014年上市以后。我当时就意识(shí)到,整个移动互(hù)联网的风口将尽(jìn),我们需(xū)要(yào)寻找下一个机会。我们在硅谷、以色列(liè)都(dōu)投资了基(jī)金(jīn),由此(cǐ)看(kàn)到了(le)人工智(zhì)能的机会(huì)。
AI让机器(qì)拥有(yǒu)感(gǎn)知能力 全力以赴打造全(quán)链条AI技术
我对人工智能(néng)有一些自己的理解(jiě)和思考,我们(men)讲了很久(jiǔ)的物联网、智能(néng)硬件(jiàn),其实(shí)在AI或者人工智能(néng)出(chū)现(xiàn)之前,所有的智能硬件都是伪智能硬件。那个时候的智能硬件本质上是联网硬件,你要掏出手机进行操作。大概在三五(wǔ)年前,各种智能硬件的(de)行业都起来了,但(dàn)是很快(kuài)这个行业又衰落了(le)。
我甚(shèn)至(zhì)想要把机(jī)器人行业划(huá)分(fèn)成两个分水岭。在AI出现之前的机器人本质上都是自动化机器,没有人的属性(xìng)。我们看产线上那么多漂亮的机械手(shǒu),其实都(dōu)是通(tōng)过(guò)非常(cháng)原始的编程和自动化的(de)设备进行生(shēng)产的。即便今(jīn)天在生产线上,也很难解决智能化的问题(tí)。
但AI出现(xiàn)以后,第(dì)一次让机器有了人类的(de)感(gǎn)知能力(lì),我们以前(qián)的摄像头看到(dào)的都是0101等一串数字,但今天摄像头看到(dào)的是人脸;以前看到的语音是波(bō)形,我们现在看到的(de)语音(yīn)是文字。
机(jī)器开始(shǐ)有了人类的感(gǎn)知能力,使得AIoT的(de)概(gài)念开(kāi)始出现,看(kàn)到(dào)这个机会以后,我(wǒ)们就去做了行业唯一的全(quán)链条(tiáo)AI技术。包括语音识(shí)别、视觉识别、导航、机(jī)械臂、麦克风阵列等,为什么要做呢(ne)?
这是从内外两个方面思(sī)考的。
第一个,猎豹移动在以前做的太快了。我(wǒ)们就做一个小工具,居然就上市了。后来等到Google发(fā)政策不让我们做工具,手机厂(chǎng)商(shāng)都开始自己(jǐ)做工(gōng)具的(de)时候,我(wǒ)们的日(rì)子就变得很艰难。所以我当时就想,拥有(yǒu)自己(jǐ)的(de)底层技术很关键。
第二个,因(yīn)为AI行业还(hái)处于早期。很多技术(shù)都(dōu)不完善,或者(zhě)没有形(xíng)成产业分工。但很多开发者,拿一块板子,拿一(yī)个所谓的开放平台,就想实现很(hěn)好的语(yǔ)音识别效果,其(qí)实(shí)是非常难的。以智能音箱为(wéi)例(lì),换一个外(wài)壳(ké)罩上去,算法就得调整,因为混(hún)响不一样。就像(xiàng),在你(nǐ)的耳朵(duǒ)上加一(yī)个耳塞,听力就可能(néng)大幅(fú)度下降,和你的大脑聪(cōng)不聪明(míng)没关系。所(suǒ)以整个人工(gōng)智能产业的链(liàn)条都非常新,又没有足够的分工。
第三(sān)个,我意识(shí)到,AI其实并不算是一(yī)个不可逾越的黑科技(jì)。很多人都说,BAT才能(néng)做AI,或(huò)者人家的积累更好一点。但(dàn)是今天看来(lái),开源代(dài)码会远(yuǎn)远丰(fēng)富于(yú)任何一个(gè)时代(dài)。很多(duō)大洋彼岸的论文出现之后,中国的工程师就很快把它实现了。所(suǒ)以,好(hǎo)处(chù)就在于,AI大大降低了技术(shù)壁(bì)垒。而且AI使得以(yǐ)前很多公司的(de)积累变得无(wú)效,大家处在同一(yī)起跑线(xiàn)上。我们认为,这是一个弯道超车(chē)的(de)好(hǎo)机会。
所以,我们当时就下定决心(xīn),把所(suǒ)以技术全都(dōu)干了(le)一遍,全力以赴打造全链条 AI 技术。全干一遍的好处就是,我们能够自主调整很多(duō)细节。
语音交互实现了命令的自然(rán)化(huà) 可能颠覆手机(jī)的中心地(dì)位
我认为(wéi)真正有智能的(de)第一(yī)个(gè)硬件品类,应该是智能音箱,我一直(zhí)在想,语音识别是什么东西(xī)?今天(tiān)有人谈“语义理(lǐ)解能力超过人(rén)”。只要看到(dào)这种标题,基(jī)本上都是骗子。
为什么这么(me)说?在语义的理解上,AI离人有巨大的(de)差距。因为(wéi)语言是人(rén)类(lèi)超(chāo)级牛的发(fā)明,你能够(gòu)把你(nǐ)对世界的理解,压(yā)缩成一串很短的文字输入给对方,对方听完以后,能(néng)把这个图像、事件还(hái)原出来,这是个相(xiàng)当牛的能力(lì),人(rén)类之(zhī)间的(de)交流是带有巨大的信息(xī)压缩和背景知识(shí)的。
所以(yǐ),今天机器完全做不到。AI想(xiǎng)在(zài)阅读理解上超(chāo)过人类,那是在一个很有限的短文章里,没有实际(jì)意义。
真正的语音(yīn)操作(zuò)是什么?我认为它的本质是实现了命(mìng)令的自然化。乔布斯有一(yī)句话说,每一次(cì)交(jiāo)互(hù)操作的演进都是(shì)一(yī)次革(gé)命(mìng)。苹果有幸抓住了两次革命,第一个是抓住了键盘和鼠标,第二个是抓(zhuā)住(zhù)了触摸屏(píng)。
今天(tiān)的手机不是因为它(tā)有(yǒu)多么(me)智能,而是因(yīn)为它有(yǒu)强大的处理能力,你可以非常(cháng)方便地touch。所以(yǐ)手机(jī)立刻取代了以前的(de)PC、电视(shì),成为了(le)你的中心位置。
但语音使得手机的(de)中心(xīn)位置有可能被颠覆掉,你(nǐ)想象一下,语音(yīn)是什(shí)么?比如,你想看《延禧攻略》,以(yǐ)往你需要(yào)从口袋里掏一个东(dōng)西,解锁、搜索(suǒ),未(wèi)来可以(yǐ)用语音就直接唤(huàn)醒:我想看《延禧攻略》。
我甚至(zhì)认为(wéi),虽然手机(jī)还是个非常关键性的设备,但下一代设备都可(kě)以变得(dé)去手机(jī)化。
两年前,我们是业内第(dì)二款做智能音箱的厂(chǎng)商。我们(联(lián)合(hé)喜马(mǎ)拉雅)做了一款(kuǎn)小雅(yǎ)音箱(xiāng),当时(shí)很多人就问我,智能(néng)音箱有多智能呢?我回答:你不要考虑(lǜ)它(tā)有多智能(néng),你(nǐ)只要考虑(lǜ)它是(shì)个摇(yáo)控器(qì),能够非常简(jiǎn)单地点歌、了解天气,设(shè)置闹钟。我们买来(lái)了对(duì)手的产品,我(wǒ)们发现(xiàn)点歌根本点不准,只有50%的准(zhǔn)确率。为什么?不是语音识别的问题(tí),而是内容(róng)上的问题。比如说今(jīn)天抖(dǒu)音出(chū)了(le)个神曲(qǔ)叫(jiào)《我们一(yī)起学猫叫》,你的曲库(kù)里得有这首歌(gē)。有的时候用户(hù)说叫“学猫叫”,有的说喵喵喵,有多(duō)种的说法。这不是一个智(zhì)能(néng)的活(huó)儿,这是个产品的活(huó)儿(ér)。
所以我(wǒ)们就把音乐(lè)的点播(bō)率和内容的点播率,这一件事儿做好了。当时,我觉得智能音箱的核心不(bú)是它有多智能,而是一种新的交(jiāo)互模式(shì)。这(zhè)种新的(de)交互模式(shì)本质上就是一(yī)个摇控(kòng)器,它把极其复杂(zá)难用的摇控器(qì)给(gěi)改(gǎi)掉了,这个进步(bù)是(shì)非常巨大的。
iphoness刚出来(lái)的时候,大家说这(zhè)个没有(yǒu)全键盘、没(méi)有硬(yìng)键盘怎么用,输入内容(róng)太慢了(le)。但(dàn)就是因为(wéi)它方便,你可以容(róng)忍它非常多不够快速的地方。
我们赋能了很多物(wù)联网的中枢,我坚(jiān)定的认为,语(yǔ)音(yīn)是下一代操(cāo)作系统的界(jiè)面,它(tā)一定(dìng)可以使得物(wù)联(lián)网的很多设备(bèi)变得(dé)智能(néng)。可(kě)以跟你(nǐ)直(zhí)接交(jiāo)互,不需要通过手机APP的方式,它自己就被赋能了。我们跟很多厂商合作了很多款音箱(xiāng),因为(wéi)我(wǒ)们觉得打音箱上(shàng)的战(zhàn)役可能打不(bú)过(guò),但是(shì)合作(zuò)是有机会的。
人(rén)工智能不会颠覆人(rén) 只要(yào)一点(diǎn)突破就会带来变革
我(wǒ)们还做了(le)一款能移动的售卖(mài)机——零售机器人(rén)豹小贩,它会主动问你是否需要商品,用(yòng)户扫描二维(wéi)码(mǎ)就可以购买。看到人多的(de)地方它就会过去,因为(wéi)它有人脸识别技术(shù)。以(yǐ)前,售(shòu)卖机只能(néng)放(fàng)在一个地方,如(rú)今,自动售卖机的(de)售卖效率,大概是(shì)传统的三到五倍,用互联网的定律看(kàn),当多一(yī)个链接,互联(lián)网就损失(shī)了50%以上的流量。而在线下零售端,当你从原有的位置走出(chū)来,让用户看到有一点点改进,效率的(de)改变(biàn)是巨大的(de)。
在机(jī)械臂方面,我专门去发那科看过他们的生产线。我个人觉得,在精密制造(zào)上和日本、德国企业去比拼,是没有(yǒu)机(jī)会的。因为他们是三(sān)十年的积累,可以用机械臂生产机(jī)械臂。但是他们面临一个(gè)问题:整个产线投产周期(qī)非常长,他要改(gǎi)变一个产品的时候,整条产线都要(yào)变,成本非常高。
我一直在想,AI 出现之后(hòu),可(kě)能不需(xū)要(yào)精密的机械臂,来做生产。我想到我奶奶的手,哆哆嗦嗦的,但她仍然能够织毛(máo)衣,还可以穿针引线。核心不是因为她(tā)的肌肉能够多么精确地控(kòng)制,而是因为她能用眼睛做最后一点点调整(zhěng)。
受此启发,我(wǒ)们在机械臂上加上了摄像头,使得它(tā)去抓(zhuā)杯子的时(shí)候(hòu),杯子怎么样放都可以抓(zhuā)得到,这(zhè)样可以降低对机械臂精度的要求。
做机械臂的(de)机床,如果从日(rì)本买,大概需要(yào) 2000 万的投资(zī),六个月之后拿货(huò),我们现在正(zhèng)在尝试(shì)用韩国产的机床(chuáng)为我们做(zuò)谐波减速器,未来可能用国产的机床。虽然(rán)精度降低了一点(diǎn)点,由于由(yóu)于有视(shì)觉技术,所以它最后肯定能完成动作。
因为机(jī)械臂最大的成本就来自于谐波减速器,我们正(zhèng)在做的机械臂,未(wèi)来可以降到市场价格(gé)的三分(fèn)之(zhī)一。当机械(xiè)臂的(de)价(jià)格降低,可能会产生新的、比工业市场大十(shí)倍的市场,市场增大(dà)十倍之后,成本又会进一步降低。在 AI 赋能之后(hòu),机械臂是有可能实现(xiàn)跨越(yuè)式(shì)增(zēng)长的。
在接待服务(wù)方(fāng)面,如(rú)果大家有兴趣的(de)话,可以去猎豹移动参观(guān)一下。我们的前台(tái)已经是机器人接待了,我们(men)是一家没(méi)有前台的公司,只有机器人。你(nǐ)来的时候,我(wǒ)在OA上提一(yī)个申请,然后你会收(shōu)到一条数字码,机器人就会过来。你跟它说“我来面试”或(huò)者开会,把数字码输上,它给你拍张照(zhào),在我们(men)的闸机上刷一下脸,你就可(kě)以进入公司,它也(yě)会带你去会议室。
今天讲人工智能(néng),很多人太强调所谓颠(diān)覆人的智能,这条路我还没(méi)有看到颠(diān)覆(fù)人的地方(fāng)。但核心是(shì)有可能实现一点点(diǎn)突破,比如说它能够把原来的(de)0101这(zhè)种信号,对应成真正(zhèng)的人脸和语音的字节的时候,其实我觉(jiào)得这个机(jī)会就已经(jīng)非(fēi)常非常巨大了。它会让很多设备具备人的感(gǎn)知能力,在一个非常(cháng)垂(chuí)直的领域(yù),完成一点点工(gōng)作(zuò)。这一点点(diǎn)工作,可能会带(dài)来巨大的(de)变革。
我们最近刚跟一(yī)个酒店签约,我们的音(yīn)箱进酒店(diàn)了。以后(hòu)你到房间以后,你(nǐ)就直接可(kě)以(yǐ)说,开灯(dēng)。你可(kě)以(yǐ)跟(gēn)音箱说:“给(gěi)我来(lái)支牙刷”,酒店系统就会收到,服务员(yuán)很(hěn)快就会把牙刷送过来(lái)。这(zhè)样的话,通过人工智能技术可以让物联网的设(shè)备变得更聪明,而且真正(zhèng)可以使得(dé)照明、空调(diào)等设备变得互联互通(tōng),非常好用。
我(wǒ)希望机器人也好,音箱也好,都能跟(gēn)各行各业(yè)合作,我们的本质不是想做一个硬(yìng)件,我们(men)的本质(zhì)还是想做(zuò)一个AI赋能的云端操作系统(tǒng),跟开发者(zhě)一(yī)起做更多的物联网设备。谢谢大家!