研究人员操纵人工智能的深度进修办法,发现了38个新的强引力透镜候选体,为研究天体物理学问题供给了新的“宇宙探针”候选体。
近年来,跟着手艺日益朝上进步,天文学研究中产生了海量数据。天文学家要想从郭守敬千里镜、“中国天眼”FAST、LSST大型综合巡天千里镜等遍及世界的大型千里镜捕捉的海量数据中找出有价值的信息以资研究,无异于大海捞针。
若何高效地处置那些数据,已成为现代天文学面对的一项重要挑战。因为人工智能在海量数据阐发和处置方面所具有的凸起优势,它也很天然地走入了天文学家的视野。
日前,中国科学院云南天文台丽江天文不雅测站龙潜研究员与云南大学中国西南天文研究所宇宙学研究组尔欣中传授团队协做,操纵人工智能深度进修的办法,发现了38个新的强引力透镜候选体,为研究天体物理学问题供给了新的可靠的“宇宙探针”候选体。英国《皇家天文学会月刊》颁发了那项研究功效。
天文不雅测产生海量数据用机器进修给天体分类已非常普及
跟着下一代大规模测光巡天项目标开展,人们等待发现数以万计的强引力透镜系统。但若何在海量天体图像中快速地找到强引力透镜候选体?近年来,人工智能的快速开展,给人类供给了一种新的可能。
以2009年发射升空的世界首个用于探测太阳系外类地行星的飞翔器开普勒太空千里镜为例,仅在起初3年半的使命期内,就监控了超越15万个恒星系统,同时也产生了海量数据。那些数据凡是要经由计算机处置,但当计算机识别出必然的信号时,又必需依靠人类阐发,判断其能否是行星轨道所产生的,那项庞大的筛查工做单靠美国国度航空航天局(NASA)的科学家或科学小组,是无法有效完成的。
“如斯大的数据量,人工阐发在良多时候已经达不到所需要的速度。借助人工智能的优势,我们能够极大地提拔对数据的阐发速度。”龙潜向科技日报记者介绍,人工智能展示出来的效率和准确性远高于传统办法。
龙潜研究员持久处置人工智能深度进修方面的研究。近期,他与尔欣中传授团队协做,构建并训练了一个卷积神经收集,用来寻找强引力透镜系统。他们把那个收集应用到欧洲南方天文台2.6米巡天千里镜(VST)千平方度巡天数据,并找到了38个新的强引力透镜候选体。此次构建的神经收集,也可应用于其他大型千里镜的巡天数据。
“在那项工做中,我们用计算机别离模仿了强引力透镜图像和非强引力透镜图像,从而来训练计算机。我们发现,在筹办训练计算机的图像时,非强引力透镜图像比强引力透镜愈加重要。”尔欣中说,起头的阐发中,他们利用简单的规则星系图像做为非强引力透镜训练样本,发现成果准确率十分低。只要把各类可能的非引力透镜图像都考虑进来之后,才气得到比力好的成果。
“那就像在教电脑认识什么是狗的时候,还要告诉它猫、羊、牛等都不是狗。而若是你只告诉它猫不是狗,电脑有十分大的概率把羊、牛认成狗。”龙潜说,目前操纵机器进修来对天文学中各类天体分类已经十分普及,最简单的是把恒星和星系分隔,或者把差别行态的星系停止分类,以及操纵星系的多重颜色来估量星系的间隔等。
每秒可识别上万张照片新型神经收集便于实时修改、训练和测试
人眼看强引力透镜系统的图像,最快就是每秒钟看一张图。而计算机每秒钟能够识别成千上万张图片。
龙潜研究员和尔欣中传授团队此番训练的那个卷积神经收集,能够足够操纵GPU停止并行加速,通过配备更多或更强的GPU,系统能够根据现实需要极大提拔搜刮速度和效率。
“那个神经收集的训练,次要利用模仿数据,只利用了很少的人工标注数据,因为模仿数据能够肆意生成,因而多样性远大于人工标注数据,进一步根据数据的特点调理训练参数和训练算法,使神经收集的泛化才能得到了极大的进步。”龙潜说,此外,研究人员利用新型科学计算语言Julia完全自定义收集构造,因为Julia语言兼具速度和灵敏性,使得神经收集在CPU和GPU上都有优良的性能,而且能够肆意切换,因而十分有利于研究人员实时修改、训练和测试。
“我们还通过对引力透镜数据的研究,定造了有针对性的小型收集,有效地按捺了过拟合现象,同时尝试证明该收集具有与大型收集类似的准确率。比拟大型收集,小型收集在通俗计算机末端就能够训练和测试,不需要依赖大型GPU集群,那为天文工做者利用和改良收集供给了便当。”龙潜说。
目前,跟着手艺与配备程度快速开展,人工智能在天文学上的应用还会越来越多。“我们方案对一些变源的多波段光变曲线来停止机器的快速分类,如许在施行大样本巡天的时候,电脑能够主动对所发现的变源停止挑选,并对我们感兴趣的天体做出提醒,以便进一步开展后续研究工做。”尔欣中说,正因为人工智能的搀扶帮助,天文研究者得以从耗时单调的数据筛查阐发中解脱出来,当人力“大海捞针”难以招架之日,恰是人工智能大显神通之时。