新浪科技讯(xùn) 1月6日上午消息(xī),据报道,旧金山人工智能研究公司OpenAI已经开发(fā)了(le)一种新系统,能根据短文本来生成图像。
OpenAI在官方博客中表(biǎo)示,这个新系统名为DALL-E,名称来源于艺术家(jiā)萨尔瓦多·达利(Salvador Dali)和(hé)皮(pí)克斯的机器(qì)人(rén)英(yīng)雄(xióng)瓦力(WALL-E)的结合。新(xīn)系统(tǒng)展示了“为一系列广(guǎng)泛的概念”创造图(tú)像的能力(lì),创作的作品包括牛(niú)油(yóu)果形状的扶(fú)手(shǒu)椅等。
通过神经网络去生成图像,这种技(jì)术并不新颖(yǐng)。此前,生成对(duì)抗网络(GAN)已被广泛用于创建真实(shí)的人(rén)、宠物、租赁房产和食物的照片。
不过,DALL-E的独特(tè)之处在(zài)于可以根据(jù)输入的文本(běn)来创作图(tú)像。该系统基(jī)于(yú)文字生(shēng)成系统(tǒng)GPT-3的一个版本,该(gāi)系统此前被(bèi)用(yòng)于撰写(xiě)诗歌和新闻文章等。利用配对好的文(wén)本和图(tú)像数据集进行训练,DALL-E可以根据新的文字(zì)提示生成图像(xiàng),此外还展示了创造多种风(fēng)格图片的能(néng)力(lì)。
OpenAI还发布(bù)了图像识别系统Clip。Clip通用性比当前针对单个任(rèn)务的(de)系统更(gèng)好,可以(yǐ)用网(wǎng)上公(gōng)开的文字图像配对(duì)数据集来训练。
DALL-E还需(xū)要继(jì)续优化(huà)。OpenAI指出,DALL-E目前(qián)的可靠性还存在问题,对类似“glass”等(děng)有多个(gè)含义的名词常常会(huì)混淆(xiáo),文字中不同的语法(fǎ)也可能(néng)会造成不同的结果(guǒ)。
此外还(hái)有更深(shēn)层次的问题需要解决(jué)。OpenAI表示:“我们注意(yì)到,涉(shè)及生成模(mó)型的(de)工(gōng)作(zuò)可能会(huì)产生重大而广泛(fàn)的社会影响。”未来可能的举措包括研究对就业岗位的影响,生成结果的偏(piān)见,以及技术的长期道(dào)德挑战。
长期以来(lái),公众一直担(dān)心人工智能生成的媒体(tǐ)内容被滥用,例如神经网络被(bèi)用来制造虚假(jiǎ)的音视频和(hé)图像,用(yòng)于不道德的(de)目的,例如政治上的假信息和欺诈活动等。