机器学习将是识别宜居系外行星的最佳方法之一

艺术家对多行星系统的印象,其中三个正在过境。 信用:美国国家航空航天局

太阳系外行星研究领域正在发生翻天覆地的变化。 迄今为止,已在 3,711 个行星系统中确认了 4,940 颗系外行星,另有 8,709 颗候选行星正在等待确认。 有如此多的行星可供研究以及望远镜灵敏度和数据分析的改进,重点正在从发现转向表征。 天体生物学家不会简单地寻找更多的行星,而是会检查“潜在可居住”的世界,寻找潜在的“生物特征”。

这是指与生命和生物过程相关的化学特征,其中最重要的特征之一是水。 作为唯一已知的生命(如我们所知)不能没有的溶剂,水被认为是寻找生命的占卜棒。 在最近的一项研究中,天体物理学家 Dang Pham 和 Lisa Kaltenegger 解释了未来的调查(结合机器学习)怎样辨别遥远系外行星上的水、雪和云的存在。

Dang Pham 是多伦多大学 David A. Dunlap 天文学与天体物理学系的研究生,专攻行星动力学研究。 Lisa Kaltenegger 是康奈尔大学天文学副教授、卡尔萨根研究所所长,也是世界领先的潜在宜居世界建模和大气特征专家。

水是地球上所有生命所依赖的东西,因此它对系外行星和天体生物学调查非常重要。 正如 Lisa Kaltenegger 通过电子邮件告诉《今日宇宙》,这种重要性反映在 NASA 的口号——“随水而动”——这也启发了他们论文的标题。

“行星表面的液态水是潜在生命的确凿证据之一——我在这里说潜力是因为我们不知道还需要什么才能让生命开始。但液态水是一个很好的开始。所以我们使用了 NASA 的口号“跟着水走”并问道,我们怎样才能在宜居带的岩石系外行星表面找到水?做光谱学是时间密集型的,因此我们正在寻找一种更快的方法来初步识别有希望的行星——那些有液态水的行星他们。”

目前,天文学家仅限于寻找莱曼-α线吸收,这表明系外行星大气中存在氢气。 这是暴露在太阳紫外线辐射下的大气水蒸气的副产品,导致它化学分解成氢气和分子氧 (O2)——前者丢失到太空中,而后者被保留。


这位艺术家的印象展示了这颗行星绕着位于船帆座(风帆)南部的类太阳恒星 HD 85512 运行。 学分:ESO

这种情况即将改变,这要归功于詹姆斯韦伯 (JWST) 和南希格雷斯罗马太空望远镜 (RST) 等下一代望远镜,以及起源太空望远镜、宜居系外行星天文台 (HabEx) 等下一代天文台) 和大型 UV/光学/IR 测量仪 (LUVOIR)。 还有地面望远镜,如超大望远镜 (ELT)、巨型麦哲伦望远镜 (GMT) 和三十米望远镜 (TMT)。

由于它们的大型主镜和先进的光谱仪、计时仪、自适应光学套件,这些仪器将能够对系外行星进行直接成像研究。 这包括研究直接从系外行星大气或表面反射的光以获得光谱,让天文学家能够看到存在哪些化学元素。 但正如他们在论文中指出的那样,这是一个耗时的过程。

天文学家首先观察数千颗恒星的亮度周期性下降,然后分析光曲线以寻找化学特征的迹象。 目前,系外行星研究人员和天体生物学家依靠业余天文学家和机器算法来整理他们的望远镜获得的大量数据。 展望未来,Pham 和 Kaltenegger 展示了更先进的机器学习将是多么重要。

正如他们所指出的,ML 技术将使天文学家能够更快地对系外行星进行初步表征,从而使天文学家能够优先考虑后续观测的目标。 通过“跟随水”,天文学家将能够将更多的天文台宝贵的调查时间用于更有可能提供显着回报的系外行星。

“下一代望远镜将寻找行星大气中的水蒸气和行星表面的水,”Kaltenegger 说。 “当然,要在行星表面找到水,你应该看看 [for water in its] 液体、固体和气体形式,就像我们在论文中所做的那样。”

“机器学习使我们能够快速识别最佳过滤器,以及在各种信噪比下的准确性权衡,”Pham 补充道。 “在第一个任务中,使用 [the open-source algorithm] XGBoost,我们得到了哪些过滤器对算法在检测水、雪或云的任务中最有帮助的排名。 在第二个任务中,我们可以观察到算法在噪声较少的情况下表现得有多好。 有了这个,我们可以画一条线,获得更多的信号并不对应更好的精度。”

机器学习将是识别宜居系外行星的最佳方法之一
系外行星 HR8799e 的艺术家插图,它是使用 ESO 的超大望远镜干涉仪上的 GRAVITY 仪器直接成像的。 学分:ESO/L。 卡尔萨达

为了确保他们的算法能够胜任这项任务,Pham 和 Kaltenegger 进行了一些相当大的校准。 这包括创建具有各种表面成分(包括雪、水和水云)的寒冷地球的 53,130 个光谱剖面。 然后,他们根据大气和表面反射率模拟了这种水的光谱,并指定了颜色配置文件。 正如 Pham 解释的那样:

“大气是使用 Exo-Prime2 建模的——Exo-Prime2 已在各种任务中通过与地球的比较得到验证。USGS 在地球上测量雪和水等表面的反射率。然后我们从这些光谱中创建颜色。我们训练 XGBoost在这些颜色上执行三个独立的目标:检测水的存在、云的存在和雪的存在。”

这个训练有素的 XGBoost 表明,云和雪比水更容易识别,这是可以预料的,因为云和雪的反照率(阳光的反射率更高)比水高得多。 他们进一步确定了五种最适合该算法的最佳滤光片,所有滤光片的宽度均为 0.2 微米,并且在可见光范围内。 最后一步是进行模拟概率评估,以评估他们确定的五个最佳过滤器中关于液态水、雪和云的行星模型。

“最后,我们 [performed] Pham 说,使用马尔科夫链蒙特卡罗 (MCMC) 对五个最佳过滤器执行相同任务的简短贝叶斯分析,作为验证我们发现的非机器学习方法。“我们的发现相似:水更难检测,但通过光度法识别水、雪和云是可行的。”

同样,他们惊讶地发现,经过训练的 XGBoost 能够仅根据颜色识别岩石行星表面的水。 根据 Kaltenegger 的说法,这就是过滤器的真正含义:一种将光分离到谨慎的“箱”中的方法。 “想象一下所有红光的垃圾箱(“红色”过滤器),然后是所有绿光的垃圾箱,从浅绿色到深绿色(“绿色”过滤器),”她说。

他们提出的方法不是通过光度法识别系外行星大气中的水,而是在系外行星表面识别水。 此外,它不适用于凌日法(又称凌日光度法),这是目前最广泛使用和最有效的系外行星探测方法。 这种方法包括观察遥远恒星的光度周期性下降,这归因于系外行星相对于观察者从恒星前面经过(又名凌日)。

有时,天文学家可以在系外行星凌日时从其大气层中获取光谱——这一过程被称为“凌日光谱”。 当太阳光相对于观察者穿过系外行星的大气层时,天文学家将用光谱仪对其进行分析,以确定那里有哪些化学物质。 JWST 将使用其灵敏的光学元件和光谱仪套件,依靠这种方法来表征系外行星的大气。