中国科大用深度学习助力实现高成功率蛋白质序列从头设计
- 2022-07-22 18:00:11 健康一线
- 健康
中新网合肥7月22日电 (记者 吴兰)记者22日从中国科学技术大学获悉,该校生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。
经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。
研究成果北京时间7月21日发表于《自然-计算科学》(Nature Computational Science)。
刘海燕、陈泉团队长期致力于发展数据驱动的蛋白质设计方法,先后建立并实验验证了对给定主链结构设计氨基酸序列的统计能量函数ABACUS模型,以及利用神经网络能量函数从头设计主链结构的SCUBA模型。然而,基于传统统计能量技术的ABACUS模型在成功率、计算效率等方面仍有不足。
近期有多项研究表明,用深度学习进行氨基酸序列设计,能够在天然氨基酸残基类型恢复率等计算指标上超过能量函数方法。但截至目前已正式发表的工作中,对相关方法的实验验证结果远未达到能量函数方法的成功率。
刘海燕介绍,利用ABACUS-R进行序列设计的方法由两部分组成。
第一部分是一个多任务预训练的编码-解码器网络,用于对单个氨基酸的结构和化学环境进行隐空间编码,再解码为包括中心残基氨基酸类型在内的多种真实特征;第二部分是把该编码解码网络迭代应用于目标主链的每个氨基酸残基,直到获得最大程度自洽的全序列。
在理论验证的基础上,团队尝试了实验表征用ABACUS-R对3个天然主链结构重新设计的57条序列,其中86%的序列(49条)可溶表达并能折叠为稳定单体。实验解析的5个高分辨晶体结构与目标结构高度一致。此外,与此前报道的从头设计蛋白相似,ABACUS-R从头设计的蛋白表现出超高热稳定性,去折叠温度大多可达100℃以上。
总的来说,相较于ABACUS模型,ABACUS-R序列设计更高的成功率和结构精度进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS-R还提供了一种对蛋白质局部结构信息的预训练表示方式,可用于序列设计以外的其他任务。
审稿人认为,该研究“最新颖的贡献在于对设计的充分实验表征,包括晶体结构,以及可溶表达的高成功率。”
本文地址://www.styjt.com/jiankang/2022-07-22/600267.html
友情提示:文章内容为作者个人观点,不代表本站立场且不构成任何建议,本站拥有对此声明的最终解释权。如果读者发现稿件侵权、失实、错误等问题,可联系我们处理
- 税务总局:新增减税降费及退税缓税缓费超3万亿元2022-07-22 18:00:11
- 中国科大用深度学习助力实现高成功率蛋白质序列从头设计2022-07-22 18:00:11
- 居民个人卫生支出占比降至27.7% 我国推动医改成效显著2022-07-22 18:00:11
- 国家卫健委:2021年居民个人卫生支出占比降至27.7%2022-07-22 18:00:11
- 国家卫健委:看病难有效缓解 看病贵得以减轻2022-07-22 18:00:11
- 国际学术期刊发文证实: 预防服用连花清瘟可降低新冠阳性率和发热率
2022-03-08
- 科兴集团国企还是私企?董事长是陶晓明吗
2022-04-26
- 什么是阴痛?
2021-10-26 10:33:42
- 12345连续三次不处理怎么办,1天打3次12345有什么后果?
2022-05-20 09:55:29
- 美立方国内外专家齐聚 颌面专家团再升级
2021-08-23 11:47:40
- 《热点聚焦》医疗机构内新冠病毒感染防控有了新要求
2021-09-15 20:00:10
- 浙大一院2021年中秋节、国庆节放假及工作安排
2021-09-12 14:00:03