机器学习将是识别宜居系外行星的最佳方法之一

太阳系外行星研究领域正在发生翻天覆地的变化。 迄今为止, 4,940 颗系外行星 已在 3,711 个行星系统中得到确认,另有 8,709 名候选者等待确认。 有如此多的行星可供研究以及望远镜灵敏度和数据分析的改进,重点正在从发现转向表征。 天体生物学家不会简单地寻找更多的行星,而是会检查“潜在可居住”的世界,寻找潜在的“生物特征”。

这是指与生命和生物过程相关的化学特征,其中最重要的特征之一是水。 作为唯一已知的生命(我们所知道的)不存在的溶剂,水被认为是寻找生命的占卜棒。 在一个 最近的研究天体物理学家 Dang Pham 和 Lisa Kaltenegger 解释了未来的调查(结合机器学习)怎样辨别遥远系外行星上的水、雪和云的存在。

党范 是一名研究生 David A. Dunlap 天文学与天体物理学系 在多伦多大学,他专门从事行星动力学研究。 丽莎·卡尔滕格 康奈尔大学天文学副教授,天文学系主任 卡尔萨根研究所,以及世界领先的建模潜在宜居世界和描述其大气特征的专家。

艺术家对多行星系统的印象,其中三个正在过境。 信用:美国国家航空航天局

水是地球上所有生命所依赖的东西,因此它对系外行星和天体生物学调查非常重要。 正如 Lisa Kaltenegger 通过电子邮件告诉《今日宇宙》的那样,这种重要性反映在 NASA 的口号中——“跟着水走”——这也启发了他们论文的标题:

“行星表面的液态水是潜在生命的确凿证据之一——我在这里说潜力是因为我们不知道我们还需要什么才能开始生命。 但液态水是一个很好的开始。 所以我们用了 NASA 的口号“Just follow the water”问,我们怎样在宜居带的岩石系外行星表面找到水? 做光谱学是时间密集型的,因此我们正在寻找一种更快的方法来初步识别有前途的行星——那些上面有液态水的行星。”

目前,天文学家仅限于寻找 莱曼阿尔法线 吸收,这表明系外行星大气中存在氢气。 这是暴露在太阳紫外线辐射下的大气水蒸气的副产品,导致它化学分解成氢气和分子氧(O2)——前者丢失到太空中,而后者被保留。

这种情况即将改变,这要归功于下一代望远镜,如 詹姆斯·韦伯 (JWST) 和 南希·格雷斯罗马太空望远镜 (RST),以及下一代天文台,如 起源太空望远镜, 这 宜居系外行星天文台 (HabEx) 和 大型紫外/光学/红外测量仪 (卢沃)。 还有地面望远镜,如 超大望远镜 (ELT), 巨型麦哲伦望远镜 (格林威治标准时间),以及 三十米望远镜 (TMT)。

这位艺术家的印象展示了这颗行星绕着位于船帆座(风帆)南部的类太阳恒星 HD 85512 运行。 学分:ESO

由于它们的大型主镜和先进的光谱仪、计时仪、自适应光学套件,这些仪器将能够对系外行星进行直接成像研究。 这包括研究直接从系外行星大气或表面反射的光以获得光谱,让天文学家能够看到存在哪些化学元素。 但正如他们在论文中指出的那样,这是一个耗时的过程。

天文学家首先观察数千颗恒星的亮度周期性下降,然后分析光曲线以寻找化学特征的迹象。 目前,系外行星研究人员和天体生物学家依靠业余天文学家和机器算法来整理他们的望远镜获得的大量数据。 展望未来,Pham 和 Kaltenegger 展示了更先进的机器学习将是多么重要。

正如他们所指出的,MI 技术将使天文学家能够更快地对系外行星进行初步表征,从而使天文学家能够优先考虑后续观测的目标。 通过“追水”,天文学家将能够将天文台的更多宝贵调查时间用于更有可能提供显着回报的系外行星。

“下一代望远镜将寻找行星大气中的水蒸气和行星表面的水,”Kaltenegger 说。 “当然,要在行星表面找到水,你应该看看 [for water in its] 液体、固体和气体形式,就像我们在论文中所做的那样。”

系外行星 HR8799e 的艺术家插图。  ESO 的超大望远镜干涉仪上的 GRAVITY 仪器首次对这颗行星及其大气层进行了直接光学观测。 图片来源:ESO/L。 卡尔萨达
系外行星 HR8799e 的艺术家插图,它是使用 ESO 的超大望远镜干涉仪上的 GRAVITY 仪器直接成像的。 学分:ESO/L。 卡尔萨达

“机器学习使我们能够快速识别最佳滤波器,以及在各种信噪比下的准确度权衡,”Pham 补充道。 “在第一个任务中,使用 [the open-source algorithm] XGBoost,我们得到了哪些过滤器对算法在检测水、雪或云的任务中最有帮助的排名。 在第二个任务中,我们可以观察到算法在噪声较少的情况下表现得有多好。 有了这个,我们可以画一条线,获得更多的信号不会对应更好的精度。”

为了确保他们的算法能够胜任这项任务,Pham 和 Kaltenegger 进行了一些相当大的校准。 这包括创建具有各种表面成分(包括雪、水和水云)的寒冷地球的 53,130 个光谱剖面。 然后,他们根据大气和表面反射率模拟了这种水的光谱,并指定了颜色配置文件。 正如 Pham 解释的那样:

“大气是使用 Exo-Prime2 建模的——Exo-Prime2 在各种任务中通过与地球的比较得到了验证。 在地球上测量雪和水等表面的反射率 美国地质调查局. 然后我们从这些光谱中创建颜色。 我们在这些颜色上训练 XGBoost 以执行三个独立的目标:检测水的存在、云的存在和雪的存在。”

这个训练有素的 XGBoost 表明,云和雪比水更容易识别,这是可以预料的,因为云和雪的反照率(阳光的反射率更高)比水高得多。 他们进一步确定了五种最适合该算法的最佳滤光片,所有滤光片的宽度均为 0.2 微米,并且在可见光范围内。 最后一步是进行模拟概率评估,以评估他们确定的五个最佳过滤器中关于液态水、雪和云的行星模型。

机器学习将是识别宜居系外行星的最佳方法之一 1
艺术家对 Nancy Grace Roman 太空望远镜(原 WFIRST)的印象。 图片来源:NASA/GSFC

“最后,我们 [performed] 使用马尔可夫链蒙特卡罗 (MCMC) 对五个最佳过滤器执行相同任务的简短贝叶斯分析,作为验证我们发现的非机器学习方法,”Pham 说。 “我们在那里的发现是相似的:水更难检测,但通过光度法识别水、雪和云是可行的。”

同样,他们惊讶地发现,经过训练的 XGBoost 能够仅根据颜色识别岩石行星表面的水。 根据 Kaltenegger 的说法,这就是过滤器的真正含义:一种将光分离到谨慎的“箱”中的方法。 “想象一下所有红光(“红色”过滤器)的垃圾箱,然后是所有绿光的垃圾箱,从浅绿色到深绿色(“绿色”过滤器),”她说。

他们提出的方法不是通过光度法识别系外行星大气中的水,而是在系外行星表面识别水。 此外,它不适用于凌日法(又称凌日光度法),这是目前最广泛使用和最有效的系外行星探测方法。 这种方法包括观察遥远恒星的光度周期性下降,这归因于系外行星相对于观察者从恒星前面经过(又名凌日)。

有时,天文学家可以在系外行星凌日时从其大气层中获取光谱——这一过程被称为“传输光谱。” 当太阳光相对于观察者穿过系外行星的大气层时,天文学家将用光谱仪对其进行分析,以确定那里有哪些化学物质。 JWST 将使用其灵敏的光学元件和光谱仪套件,依靠这种方法来表征系外行星的大气。

系外行星 HR8799e 的艺术家插图。  ESO 的超大望远镜干涉仪上的 GRAVITY 仪器首次对这颗行星及其大气层进行了直接光学观测。 图片来源:ESO/L。 卡尔萨达
由 ESO 的 GRAVITY 仪器在其超大望远镜干涉仪上直接拍摄的系外行星 HR8799e 的艺术家插图。 学分:ESO/L。 卡尔萨达

但正如 Pham 和 Kaltenegger 所指出的,他们的算法仅适用于系外行星直接成像的反射光。 考虑到通过直接成像研究获得的光谱学可能会揭示更多关于系外行星的信息,而不仅仅是它们大气的化学成分,这尤其是个好消息。 根据 Kaltenegger 的说法,这为下一代任务创造了各种机会:

“这为像南希罗马望远镜这样的小型太空任务开辟了机会,以帮助识别可能存在生命的世界。 对于即将推出的更大的望远镜——正如十年调查所推荐的——它允许他们扫描宜居带中的岩石行星以寻找最有希望的候选者——那些表面有水的行星,所以我们花时间描述最有趣的那些——和有效地在具有良好启动条件的行星上寻找生命。”

描述他们的发现最近发表在皇家天文学会月报(MNRAS)上。

延伸阅读: arXiv