想象(xiàng)一下(xià),星团、星云和其他星际(jì)现象都是由(yóu)计算机在无(wú)人监督(dū)的情况下凭空(kōng)生成的。这听起来可能(néng)像(xiàng)是对未来(lái)全息技术(shù)的描述,但是爱丁堡大学(xué)感知研究(jiū)所和天文学研究所的研(yán)究人员,就在人工(gōng)智能的帮助下(xià)设计了这样一个系统。
研究人员描述了(le)一(yī)种人工(gōng)智能模型,该模型(xíng)能(néng)够生成合成星(xīng)系的高(gāo)分辨率图像,这些(xiē)图像遵循(xún)了(le)真实的星系分布。
“21世纪(jì)的天文学发现自(zì)己拥有大量数据(jù),大部分数据在捕获时会被过滤掉(diào),以节省内(nèi)存存储,”他们写道。“对于(yú)深度学习等现代(dài)技术来说,进入这(zhè)一(yī)领域的时机(jī)已经成(chéng)熟。星系在这类应(yīng)用中起了关键作用,我们探索了利用人工智(zhì)能来生成星(xīng)系图像的可能性。”
该(gāi)团队机器学习架(jià)构的(de)核心是生成对抗性网络(GAN)——由(yóu)生成样本的生成器和试图(tú)区分生成(chéng)样本和真实(shí)样本(běn)的(de)鉴别器组成的两部分神经网络。将GAN描述为AI算法中(zhōng)的“神(shén)童”并不夸张;它们被用来发现新药,制(zhì)作令人信服的(de)汉堡和蝴蝶(dié)照片(piàn),甚至生成脑癌的(de)人工(gōng)扫描图。
这一星系(xì)生(shēng)成(chéng)系统由两个五层GANs组成:阶段一GAN和阶段二(èr)GAN。第(dì)一个生成低分(fèn)辨率图像(64x64像素),而第二个使(shǐ)用一种叫做超分辨(biàn)率的技术将它们(men)转换(huàn)成(chéng)高(gāo)分辨率图像(128x128像素)。研究人员指出,在实际过(guò)程中,阶段二GAN会自我填充缺失的像素(sù),更加注重(chóng)现实性而非(fēi)准(zhǔn)确性。
为(wéi)了“鼓励”阶(jiē)段二GAN中的生成器生成类似于放大实像对应物的合(hé)成星系图像,该(gāi)论文作者引入了一(yī)个“双目标函数”,该(gāi)函数(shù)计算了分辨率(lǜ)增强(qiáng)图像和实像之间(jiān)的(de)误(wù)差标准。其结果是生成了大量保留星系“更稀(xī)有”特征(zhēng)的样本,如(rú)旋臂(bì)。
研究人员(yuán)使用英(yīng)伟达GTX 1060 GPU在PC上(shàng)训练(liàn)人工智(zhì)能系统,并为其(qí)提供(gòng)来自Galaxy Zoo 2数据(jù)集(jí)的恒星和行星体的(de)全(quán)色图(tú)像,Galaxy Zoo 2是一(yī)个众包天文(wén)学项(xiàng)目。他们在(zài)评估结果(guǒ)时考虑(lǜ)了四个属性(xìng):椭圆度,或偏离圆(yuán)形度的程度(dù);与水平(píng)面的仰角;总流量(liàng);以及半长(zhǎng)轴(椭圆最长直径(jìng)的(de)一(yī)半)的尺寸测(cè)量(liàng)。
在论文的(de)最后,研究人员写道(dào),该模(mó)型(xíng)生成了非常类似真实星系(xì)“物(wù)理真(zhēn)实”的图像。他们认为(wéi),这一系统(tǒng)可以被用来扩充真(zhēn)实样本的数据库,实际上这也是(shì)深度学习模(mó)型的数据源。
“能够(gòu)创建物理真实的星系图像生成模(mó)型有许多(duō)实际(jì)用途,”他们写道。“我们的工作(zuò)展示了(le)GAN架构作为现代天文学宝贵工具的(de)潜力。”