当前(qián),以深(shēn)度学(xué)习为代表的人工智能技术已经应用到各个行业。驱动人工(gōng)智(zhì)能技(jì)术蓬勃发展的是各行各业积累的大数据。可以说(shuō),正是在大数(shù)据的(de)“喂养(yǎng)”下,人工智能技术才真(zhēn)正茁壮成长。
然(rán)而,在近(jìn)日召开的香山科学会议(yì)第(dì)667次(cì)学术讨论会上(shàng),与(yǔ)会专家指出,大数据的“红利”效应(yīng)正在逐渐减弱,人工智能技术(shù)的单点突破难(nán)以持续支撑行(háng)业发展,亟须在数据科学和(hé)计算智能方面突破(pò)一(yī)些关(guān)键(jiàn)核心技术(shù)。
主(zhǔ)流AI算(suàn)法未充分考(kǎo)虑大数据复杂性
人们常(cháng)常用(yòng)海(hǎi)量(liàng)性、多样(yàng)性、高速以(yǐ)及价值密度(dù)低来描(miáo)述(shù)大数(shù)据的特点。但真实的大数(shù)据往往更加复(fù)杂,比如具有不完全性、不确(què)定性、动(dòng)态(tài)性、关联性等特点。反观经典的人工智能算法(fǎ),它们对数据的假(jiǎ)设往往过于(yú)简单。比如,假设(shè)数据是静态的,产生于独立同分(fèn)布的采样(yàng)过程;训练(liàn)数据(jù)是可靠的、数据所承载的信息是完(wán)全的等。
“数据的真实复杂性(xìng)和算法的简单假设之间存在(zài)着巨大鸿沟,这使(shǐ)得经典智能(néng)算法在很多复杂任务上表现(xiàn)欠佳,亟待进一步的研(yán)究和探(tàn)索。”会议执行主席之一、中(zhōng)国科(kē)学院院士梅宏强调,大(dà)数据是人工智能获得(dé)成功的(de)物(wù)质基础(chǔ),但目(mù)前主(zhǔ)流(liú)的人工智能算法并未(wèi)充(chōng)分考虑大数据本(běn)身的复杂性。
从计(jì)算和(hé)通信领域(yù)看,大(dà)数据与人工智能技术在大规(guī)模工程化应用方面取得了长足进步。然而(ér),大(dà)数据(jù)处理的技(jì)术(shù)进(jìn)步主(zhǔ)要体现在:以(yǐ)软硬件垂直优化(huà)和体(tǐ)系重构(gòu)的(de)极端化方式来适应数据(jù)规(guī)模、传输带宽(kuān)和处理速(sù)度的(de)提升,研究人员(yuán)对大数据固有的非确定性和(hé)复杂性尚没有深刻认(rèn)识;与此同时,人工智能(néng)技术也面临鲁棒(bàng)性、可解释性和(hé)复杂系统认知瓶颈等挑战(zhàn)。
梅(méi)宏进(jìn)一(yī)步指出,当前数据(jù)智(zhì)能(néng)存(cún)在低效(xiào)、不通用以(yǐ)及不透明(míng)三大问题。“现在的(de)数据智能就像工业革命(mìng)前的‘蒸汽机原型’一样,低效而(ér)昂贵;它(tā)只(zhī)能针对不同应用定制不同模型,难以建立通(tōng)用模型。”梅宏说,更重要的是,当前并没(méi)有对数据智(zhì)能形成(chéng)深刻(kè)认识,只是知(zhī)其然,而(ér)不知其所以然。
人机融合或可弥补数(shù)据自动推理弱点
在中国科学院自动化研究(jiū)所研究员陶建华(huá)看来,虽然当前人工智能(néng)在数(shù)据自动推理中依然面临(lín)很多技术难点,但是人(rén)机(jī)融(róng)合的推理方式(shì)可以(yǐ)有效地弥补这些弱点。人机融合(hé)推理着(zhe)重于(yú)研究(jiū)一种由(yóu)人和机器相互协作(zuò)下的新(xīn)的(de)推理模式,包含(hán)“机器懂人”和“人懂机器”两(liǎng)方面的含义。
对人的推理思(sī)维的理解(jiě)是“机器懂人”的关键。其核心问题是如何构建能够反映(yìng)人推理过(guò)程(chéng)的思维形式化计算方法。该方法将人的推(tuī)理(lǐ)思维形式化描(miáo)述、概率推理(lǐ)、构建知识(shí)图谱,以(yǐ)及与(yǔ)现实(shí)场景的信息进行(háng)有机融合,从而可以(yǐ)将人的推理过程有效的输入到(dào)机器中,并与机器的推理网络(luò)进行结合(hé)。
此外,解决“人懂机(jī)器”问题将有(yǒu)助于人对机器智能辅助增强。机器推理(lǐ)过程的可解释性(xìng),对(duì)于构建人机融合的推理过程尤为关键。过(guò)程可解释的机器推理方法提供了解决问题(tí)的新(xīn)方法,适当的扩展流程,并最大限度地减少人为错误的机会,可以(yǐ)帮(bāng)助人类和机器协同做出更为准确和迅速的推理与(yǔ)判断(duàn)。
微软亚洲研究(jiū)院副院长刘铁岩结合他们的(de)实际工作举例道:“我(wǒ)们在深度(dù)强化学(xué)习的基础上(shàng),利用‘完美教练(liàn)’技术来处理信息的(de)不(bú)完全和不确定性,从(cóng)而(ér)很好(hǎo)地解决了麻将这一复杂的博(bó)弈问题。我们的算法在2019年3月登陆知(zhī)名的竞技麻将平台,经过5000局(jú)的鏖战(zhàn),成(chéng)功晋级十段(duàn),其稳定段位显(xiǎn)著超越人类顶级(jí)选手(shǒu),成为首个超人麻将(jiāng)AI。”这是在处理数据不完全(quán)性和不(bú)确定性方面做出的有益尝试。
刘(liú)铁岩指出,大数据特性在不断(duàn)演(yǎn)化(huà),且愈发(fā)复杂(zá)。新(xīn)型智能(néng)算(suàn)法需要针对数据(jù)特点有(yǒu)的放矢地解(jiě)决问题,这样(yàng)才能填补数(shù)据与算(suàn)法间(jiān)的鸿沟(gōu),使人工智(zhì)能绽放更多的价值。