在生物学研究中,人工智能(AI)可以筛选数十万个基因组数据点,识别出潜在治疗靶点。但科学家仍不确定AI模型是如何得到这些结果的。据最新一期《自然·机器智能》杂志报道,一种名为SQUID的新系统已经出现,它能“撬开”AI模糊的内部逻辑的“黑匣子”。
SQUID的计算流程示意图。图片来源:冷泉港实验室
SQUID全称是“深度网络替代定量可解释性”,是美国冷泉港实验室(CSHL)科学家创造的一种计算工具,旨在帮助解释AI模型如何分析基因组。与其他分析工具相比,SQUID更具一致性,减少了背景噪音,可以更准确地预测基因突变的影响。
CSHL助理教授彼得·库解释说,SQUID能发挥作用的关键原因在于对它的专门训练。人们用来理解这些模型的工具主要来自计算机视觉或自然语言处理等其他领域。虽然它们很有用,但并不是基因组学的最佳选择。此次,科学家对SQUID所做的训练,就是利用数十年的定量遗传学知识来帮助人们理解这些深度神经网络正在学习什么。
SQUID的原理是,首先生成一个包含10万多个变异DNA序列的数据库,然后用一个名为MAVE-NN(变异效应神经网络多重分析)的程序来分析库中的突变及其影响。该工具让科学家能同时进行数千个虚拟实验,最终“钓出”预测最准确的AI算法。这种算法可为更贴近现实的实验奠定基础。
计算机虚拟实验无法替代真实的实验室实验。尽管如此,它们可以提供非常丰富的信息,帮助科学家理解基因组特定区域如何运作、突变会产生什么影响。
AI领域的模型数量巨大,研究团队希望SQUID能帮助科学家找到最符合他们需求的模型。例如人类基因组研究领域,SQUID可以帮助生物学家更精准地把握相关发现的医学价值,推动这些发现向临床医疗应用的转化。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。