人工智能发现与疾病相关的基因

人工神经网络可以揭示大量基因表达数据中的模式,并发现与疾病相关的基因组。林雪平大学研究人员领导的一项新研究表明了这一点,该研究发表在《自然通讯》上。科学家希望该方法最终可以应用于精密医学和个性化治疗。

使用社交媒体时,该平台通常会建议您可能想要添加为朋友的人。该建议基于您和其他具有共同联系的人,这表明您可能彼此认识。科学家以类似的方式根据不同蛋白质或基因如何相互作用来绘制生物网络图。一项新研究背后的研究人员已经使用人工智能AI来研究是否有可能通过深度学习发现生物网络,在这种网络中,被称为“人工神经网络”的实体是通过实验数据进行训练的。由于人工神经网络擅长学习如何在大量复杂数据中查找模式,因此它们被用于图像识别等应用中。但是,迄今为止,这种机器学习方法很少用于生物学研究中。

“我们第一次使用深度学习来发现与疾病相关的基因。这是一种用于分析大量生物信息或大数据的非常有效的方法,”物理,化学系博士后Sanjiv Dwivedi说。林雪平大学生物与生物学(IFM)。

科学家使用了一个大型数据库,其中包含有关许多人中20,000个基因的表达模式的信息。从某种意义上说,研究人员没有提供人工神经网络信息,即有关哪些基因表达模式来自疾病患者以及哪些来自健康人群的信息,因此该信息是“未分类的”。然后训练AI模型以发现基因表达模式。

机器学习的挑战之一是不可能确切地看到人工神经网络如何解决任务。有时将AI称为“黑匣子”,我们只能看到放入该框的信息及其产生的结果。我们看不到它们之间的步骤。人工神经网络由几层组成,其中对信息进行数学处理。该网络包括输入层和输出层,该输入层和输出层传递由系统执行的信息处理的结果。在这两层之间是几个隐藏层,在其中进行计算。当科学家们训练了人工神经网络时,他们想知道是否有可能以某种方式抬起黑匣子的盖子,并理解它是如何工作的。神经网络和熟悉的生物网络的设计是否相似?

“当我们分析神经网络时,结果发现第一隐藏层在很大程度上代表了各种蛋白质之间的相互作用。相比之下,在模型的更深层的第三层,我们发现了不同细胞类型的组。这非常有趣鉴于我们的网络已经从未分类的基因表达数据开始,这种类型的生物学相关分组是自动产生的,” IFM高级讲师兼研究负责人Mika Gustafsson说。

然后,科学家们研究了他们的基因表达模型是否可用于确定哪些基因表达模式与疾病有关,哪些与疾病有关。他们确认该模型发现了与人体生物学机制相吻合的相关模式。由于该模型是使用未分类的数据训练的,因此人工神经网络可能已经找到了全新的模式。研究人员现在计划从生物学的角度研究这种先前未知的模式是否相关。

“我们认为该领域取得进展的关键是了解神经网络。这可以教会我们有关生物学环境的新知识,例如许多因素相互作用的疾病。而且我们认为我们的方法所提供的模型更易于推广而且可以用于许多不同类型的生物学信息。” Mika Gustafsson说。

米卡·古斯塔夫森(Mika Gustafsson)希望与医学研究人员的紧密合作将使他能够将研究中开发的方法应用于精密医学。例如,可以确定哪些患者组应该接受某种类型的药物,或者确定受影响最严重的患者。