在垃圾基因中发现自闭症的新病因

研究人员利用人工智能技术证明,所谓的“垃圾”DNA突变会导致自闭症。这项研究发表在5月27日的《自然遗传学》上,是第一项将这种突变与神经发育联系起来的研究。

这项研究由奥尔加特罗扬斯卡娅和罗伯特达内尔合作领导。Troyanskaya是纽约市计算生物学教授(CCB)和普林斯顿大学计算机科学系铁研究所中心基因组学副主任。达内尔是洛克菲勒大学癌症生物学的罗伯特和哈丽特海勒布伦教授,也是霍华德休斯医学研究所的研究员。

他们的团队使用机器学习分析了1790名自闭症患者及其未受影响的父母和兄弟姐妹的整个基因组。这些人没有自闭症家族史,这意味着他们患病的遗传原因可能是自发突变,而不是基因突变。

这项分析预测了基因组中不编码蛋白质的基因突变分支,这些区域经常被误认为是“垃圾”DNA。与非编码突变相关的自闭症病例数等于与使基因功能丧失的蛋白质编码突变相关的病例数。

特罗亚斯卡娅说,这项工作的意义不仅仅是自闭症。“这是首次明确证实非遗传非编码突变会导致任何复杂的人类疾病或紊乱。”

该报告的共同作者、普林斯顿大学的CCB和Jian Zhou表示,科学家可以应用新研究中使用的相同技术,探索非编码突变在癌症和心脏病等疾病中的作用。“这让人们对自闭症的成因有了新的认识,不仅是自闭症,还有很多人类疾病。”

只有1%到2%的人类基因组由编码蛋白质蓝图的基因组成。这些蛋白质在我们体内执行任务,如调节血糖水平、对抗感染和发送细胞间的通信。然而,我们基因组的另外98%并不是死重量。非编码区有助于调节基因何时何地产生蛋白质。

在没有自闭症家族史的个体中,蛋白质编码区的突变占自闭症病例的30%。证据表明,导致自闭症的突变也一定发生在基因组的其他地方。

很难揭示哪些非编码突变可能导致自闭症。单个个体可能有几十个非编码突变,其中大多数是个体独有的。这使得识别受影响人群中常见突变的传统方法变得不可能。

特罗亚斯卡娅和她的同事采取了一种新的方法。他们训练机器学习模型来预测给定序列将如何影响基因表达。

普林斯顿Troyanskaya实验室的研究科学家Chandra Theesfeld说:“这是我们在分析中引入的基因研究理念的改变。”“除了研究大群个体的常见基因突变的科学家,我们在这里还应用了一套智能而复杂的工具,告诉我们任何特定的突变会发生什么,甚至是那些罕见的或以前从未观察到的突变。”

研究人员通过将机器学习模型应用于名为西蒙斯单纯形集合的遗传数据宝库来研究自闭症的遗传基础。西蒙斯基金会,铁研究所的母组织,是生产和维护的仓库。Ons Simplex Collection包含了近2000个“四重奏”的全基因组,由自闭症儿童、未受影响的兄弟姐妹及其未受影响的父母组成。

这四个群体过去没有自闭症家族史,这意味着非遗传性突变可能是患病儿童患病的原因。(这种突变在精子、卵子和胚胎中自发发生。)

研究人员使用他们的模型来预测每个自闭症儿童的非遗传非编码突变的影响。然后,他们将这些预测与儿童未受影响的兄弟姐妹中相同的、未改变的链条的影响进行比较。

“西蒙斯单纯形集合的设计使我们能够进行这项研究,”周说。"未受影响的兄弟姐妹是一种内在的控制力。"

分析表明,自闭症儿童的许多非编码突变改变了基因调控。此外,研究结果表明,突变会影响大脑中的基因表达和已经与自闭症相关的基因,例如负责神经元迁移和发育的基因。“这与大脑中最有可能的自闭症表现相一致,”建行研究科学家、该研究的合著者克里斯托弗帕克(Christopher Park)说。“这不仅仅是突变的数量,而是发生了什么样的突变。”

研究人员在实验室实验中测试了一些非编码突变的影响。他们将自闭症儿童中发现的预测高影响突变插入细胞,并观察基因表达的变化。这些变化证实了模型的预测。

Troyanskaya说,她和她的同事将继续改进和扩展他们的方法。最后,她希望这项工作能够改善基因数据如何被用来诊断和治疗疾病。“现在,98%的基因组通常都被扔掉了,”她说。“我们的工作可以让你思考98%我们能做什么。”

研究人员利用人工智能技术证明,所谓的“垃圾”DNA突变会导致自闭症。这项研究发表在5月27日的《自然遗传学》上,是第一项将这种突变与神经发育联系起来的研究。这项

本文地址:http://www.bx9y.com/zhengzhuang/2021-12-15/562261.html

友情提示:文章内容为作者个人观点,不代表本站立场且不构成任何建议,本站拥有对此声明的最终解释权。如果读者发现稿件侵权、失实、错误等问题,可联系我们处理

半岛平台官网入口网站下载
7*24小时半岛电子下载入口
健康图文排名
Baidu
map