2017 年(nián)底,国(guó)外(wài)论坛出现的(de)一个ID 为“deepfakes”的用户发布了通过机器学习来更换视频人脸的人(rén)工智能算法(fǎ),一脚踢开了人工智能(néng)换脸大(dà)门。不过当时(shí)该(gāi)技术(shù)的使用(yòng)门槛还(hái)比较高(gāo),需要编译代码等操作。
而一(yī)个(gè)月后,有人将他公开的的算法加以(yǐ)改造推出简易(yì)版人工智能换脸工具(jù)“FakeApp”,这次,就算是普通用户,也能够顺(shùn)利(lì)操作。
随着(zhe)换脸技术(shù)的升(shēng)级(jí)及相关应用的开源(yuán),换脸用途(tú)也(yě)从(cóng)最初的娱乐逐渐演变成犯罪(zuì)工具,引发(fā)了人(rén)们越来越多(duō)对人(rén)工(gōng)智能换脸的(de)担忧。
首(shǒu)先是(shì)对于信息的真实性形成严峻的挑战。PS 发明后,有图不(bú)再有(yǒu)真相;而人(rén)工智(zhì)能换脸技术的(de)出现,则让图像也开始变得镜花水月了(le)起来:这对(duì)于本来就(jiù)假消息满天飞的互联网来说,无疑会(huì)造(zào)成进(jìn)一步的信任崩坏(huài)。
其次,这会大(dà)大增加侵犯肖(xiāo)像权(quán)的可能,没人愿意(yì)自己的脸庞出现在莫名其妙的视(shì)频当中(zhōng),此(cǐ)前就有在某成人视频网(wǎng)站上,某女星的脸被(bèi)“安(ān)”在(zài)了成(chéng)人视频(pín)女主角(jiǎo)脸上的报道(dào),这将(jiāng)给女(nǚ)星的名(míng)誉带来极(jí)大的负(fù)面影响。
鉴(jiàn)于这项(xiàng)技术所带来的伦(lún)理问题(tí)和潜在威胁,先进(jìn)的 DeepFake 检测技术将非常重(chóng)要。
在以前的(de)研究中,DeepFake 视频检测主要专注于在具(jù)备强监督(dū)标(biāo)注的情况(kuàng)下,如何较好地检测到 DeepFake 图像(xiàng)或者人脸。
现在,阿里安全图灵(líng)实验室(shì)和中科院计算所合作完成的一项研究(jiū)更(gèng)加关注现(xiàn)实中广泛存在的问题:部分攻击(篡改(gǎi))的视频,即视(shì)频中只有部分(fèn)人脸被篡改了。
具体(tǐ)来(lái)说,该研究(jiū)提出了基于(yú)多实例学(xué)习的 DeepFake 检测框架,将人脸和输(shū)入视频分别当作多实(shí)例学习 (Multiple Instance Learning, MIL) 里的实(shí)例(lì)和(hé)包(bāo)进行检测。
然(rán)而,传统的多实例学(xué)习存在梯度消(xiāo)失问题。为此,研究人员提出了 Sharp-MIL (S-MIL),将多个实(shí)例(lì)的聚合由输出(chū)层提前(qián)到特征层,一方(fāng)面使得聚合更加灵活,另一方面也利用伪造检测的(de)目标函数(shù)直接指导实例(lì)级深(shēn)度表征的学习,从而(ér)缓(huǎn)解传统多实例学习(xí)面(miàn)临的(de)梯度消失难题。该研究通(tōng)过理论证(zhèng)明(míng)了 S-MIL 可以(yǐ)缓解(jiě)传(chuán)统 MIL 存在的(de)梯度消失问题。
研究人(rén)员表示,除了部分换(huàn)脸检测任务(wù)之外,该研究成果对于一般性的视频多实例学习与(yǔ)标(biāo)注(zhù)技术研究也(yě)具有(yǒu)重要的(de)启发意义,而人工智能换脸技术及其检测技术也值得(dé)我们(men)持续关(guān)注。