人工智能助力研究人员了解肺部疾病并提出治疗方案
特发性肺纤维化(IPF)的秘密就藏在它的名字里。“特发性”意味着病因不明,这种将健康肺组织转变为纤维瘢痕组织的病症仍存在许多疑问。
IPF始于肺外周并向内发展,损害越来越多的组织,最终导致患者呼吸困难。IPF无法治愈,获批的两种治疗药物也都无法逆转瘢痕,只能减缓进程。
6月20日发表于《自然·生物医学工程》的一项新研究中,耶鲁医学院的研究人员及其合作者通过一种解读疾病数据并提出治疗方案的算法,在理解IPF及众多其他复杂疾病方面迈出了重要一步。
研究团队开发了一种名为UNAGI(统一的计算机内细胞动力学和药物筛选框架)的深度生成神经网络,可识别特定疾病数据中的模式。根据计算机性能,在数小时或数天内,UNAGI能学会从数十万个细胞中收集信息,区分细胞类型,挑出与疾病进展有关的基因,并识别相关调控网络。然后,它尝试不同的药物,从一长串已获批的化合物中筛选,看是否有对正在研究的疾病有效的药物。
虽然UNAGI是利用IPF数据开发的,但也可应用于生理状态的改变(如衰老)和其他疾病,研究人员用新冠数据进行了演示。
“该模型寻找调控因素——表征和调控变化的因素,然后利用已知的药物数据库提出治疗方案。”共同资深作者、耶鲁医学院医学(肺部)教授、勃林格殷格翰制药公司的纳夫塔利·卡明斯基医学博士说。
这项研究是与加拿大麦吉尔大学、比利时鲁汶大学和其他几个机构的科学家合作完成的。
在IPF中,疾病分布是可变的,有些区域比其他区域“病得更重”。几年前,卡明斯基和鲁汶大学的合作者开发了一种跟踪IPF进展的方法,通过对单个样本内的疾病进展进行分级,无需对同一患者进行反复随访(这对研究人员来说可能是个挑战)。
鲁汶大学的团队在移植手术中收集患病肺脏,切成薄片,选取小块来代表疾病的不同阶段。耶鲁团队对这些样本中的单个细胞的基因表达模式进行分类,绘制出肺纤维化单细胞图谱。
“我们有一些关键发现,包括新的细胞类型和细胞群。”卡明斯基说。但研究人员想要更好地理解疾病发展轨迹,却缺乏分析数据的工具。“所以,我们开始思考将人工智能应用于这个问题的方法。”
卡明斯基与麦吉尔大学医学院助理教授丁军(音译)博士合作,丁军领导着一个专门从事计算生物学的实验室。研究人员利用卡明斯基提供的23万个细胞的测序数据开发了UNAGI。
“我们的模型旨在呈现虚拟细胞和虚拟疾病进展。”丁军说。与大多数通用的现有模型不同,UNAGI是基于疾病信息的,即通过识别相关基因和调控网络对相关疾病进行建模。然后将该信息反馈到模型中,优化细胞和疾病进展的呈现以增加细微差别。UNAGI也几乎不需要研究人员的监督,通过嵌入式迭代优化过程自主学习。相比之下,其他模型必须手动重新训练以解读新数据集或测试不同药物,这既昂贵又耗时。
UNAGI通过沿途整合新信息来绕过这种需求,深入挖掘数据,直至能确切指出哪些细胞、基因和通路与疾病进展有关。“模型不断进化以更多地了解疾病。”丁军说。“这是一种双向的信息交换。”
然后,从数千种作用机制已知的药物数据库中,UNAGI可测试数千种化合物并列出一小部分潜在的治疗药物。在这项研究中,它确定了8种可能的药物,其中一种已用于IPF。研究人员从列表中选择了一种看似不合适的药物进行验证研究。他们选择的是一种名为硝苯地平的钙通道阻滞剂,用于治疗高血压,但UNAGI认为它可能也有抗纤维化作用。
当研究人员将这种药物应用于模拟IPF的人肺组织切片时,药物如UNAGI所预测的那样阻止了瘢痕组织的形成。卡明斯基说,即使硝苯地平最终不适合用于纤维化治疗,“UNAGI触及了我们以前从未想过的通路”。
他补充说,将单细胞测序等技术与人工智能相结合将塑造这个领域的未来。“我们将非常复杂的基于人工智能的分析方法与生成高分辨率数据以进行实际观测的能力相结合。”
德国汉诺威医学院、美国太平洋西北国家实验室、贝勒医学院和匹兹堡大学的研究人员也参与了这项工作。
本新闻报道中的研究得到了美国国立卫生研究院(资助编号R01HL127349、R01HL141852、U01HL145567、R21HL161723、P01HL11450和U01HL148860)和耶鲁大学的支持。内容仅由作者负责,不一定代表美国国立卫生研究院的官方观点。这项工作还得到了美国国防部、埃尔塞·克勒纳 - 费森尤斯基金会、汉诺威医学院CORE100Pilot(高级)临床科学家项目和德国研究基金会的支持。