Hi!请登陆

男性“秃头元凶”长啥样?腾讯AI Lab联合研究登上Nature子刊,首次破解它的结构

2020-11-18 31 11/18

当下年轻人调侃最多的话题是什么?恐怕除了枸杞保温杯,还有头上日益稀疏的头发。

近日,国家卫健委发布了脱发人群调查数据,我国已经有超过 2.5 亿人脱发,平均 6 个人里面就有 1 个人秃头,90 后作为脱发主力军,也带火了一大批 " 头顶生意 "。

无数人在辗转反侧的夜里,都会问出一个灵魂问题:" 为什么脱发的会是我?"

雷锋网消息,11 月 17 日,腾讯公布了一项人工智能助力药物发现的新进展。

通过腾讯自研的提升蛋白质结构预测精度的新方法,联合研究团队首次解析了 II 型 5a 还原酶(SRD5A2)的三维结构,揭示了治疗脱发和前列腺增生的药物分子 " 非那雄胺 " 对于该酶的抑制机制,这将有助于深化研究相关疾病的病理学机制及药物优化。

此次,腾讯 AI Lab 采用 " 从头折叠 " 的蛋白质结构预测方法帮助解析了 SRD5A2 晶体结构,并通过自研 AI 工具 " tFold" 有效提升了蛋白质结构预测精度,在科研突破中发挥了核心作用。

除了在 SRD5A2 结构中的应用,这套方法还可以拓展应用于蛋白质分子和病理学机制的相关研究中。

该项联合研究成果于近日登上了国际顶级期刊 Nature 子刊《 Nature Communications》。论文题为《人体类固醇 II 型 5a 还原酶与抗雄激素药物非那雄胺的结构研究》,由南科大生物系魏志毅副教授课题组与匹兹堡大学张诚教授、新加坡 A*STAR 研究所范昊研究员、腾讯 AI Lab
黄俊洲博士带领的研究小组合作完成。本次得到权威学术期刊发表及评审的高度评价,也验证了该成果对药物研发的创新价值。

论文链接:https://www.nature.com/articles/s41467-020-19249-z

据了解,tFold 工具还在 CAMEO(全球唯一的蛋白质结构预测自动评估平台)的国际测评中连续半年保持周度冠军。目前,tFold 公测版本已通过腾讯「云深智药(iDrug)」平台官网对外开放。

官网链接:https://drug.ai.tencent.com/console/cn/tfold

" 从头折叠 " 新方法破解晶体学难题

在人体内,性激素有促进性器官成熟、副性征发育及维持性功能等作用。

二氢睾酮是人体中已知最强的雄激素,对于人体的发育和生理活动至关重要,但同时也需要保持合理的平衡。

一方面,二氢睾酮控制着男性性器官的发育,水平过低将导致男性性征缺陷。

另一方面,水平过高又是导致前列腺增生和脱发的罪魁祸首。

合成性激素依赖类固醇还原酶,二氢睾酮即由 SRD5A2 催化合成。因此,当患者因为二氢睾酮水平过高而出现前列腺增生和脱发问题时,可以通过抑制 SRD5A2 来降低患者二氢睾酮水平。作为 SRD5A2 的高效抑制剂,非那雄胺(finasteride)被广泛用于治疗这类疾病。

尽管 SRD5A2 具有重要生理作用,其高分辨率结构信息却十分缺乏,导致 SRD5A2 催化二氢睾酮合成的机理以及非那雄胺抑制 SRD5A2 酶活的机制并不清晰。

这是由于 SRD5A2 具有独特的七次跨膜结构,其与人类全部已知结构的蛋白在结构上存在较大差异,难以通过 " 模板建模 "(template-based modeling)方法获得初始构型来解析晶体数据。同时又因为 SRD5A2 是一类多次跨膜蛋白,使得传统的用于获取蛋白质晶体相位信息的 " 重原子替代 " ( Heavy-atom derivatization ) 方法亦难以奏效。

为了解决这一难题,腾讯 AI Lab 科研团队采用了难度更高的 " 从头折叠 "(de novo folding)方法来预测 SRD5A2 蛋白的三维结构,并将其用于 " 分子置换 "(molecular replacement, MR)的初始构型来解析晶体数据。

雷锋网了解到,所谓 " 从头折叠 ",是相对于 " 模板建模 " 的一种蛋白质结构预测方法。

" 模板建模 " 是目前最普遍的蛋白结构预测手段,但有一个使用前提——人类已知的蛋白结构数据库(即 PDB)当中,必须存在和预测的蛋白相似的结构,否则就无法使用。而腾讯 AI Lab 采用的 " 从头折叠 " 方法则跳出了这个限制,可以不依赖于模板来预测蛋白结构。

但此前,通过 " 从头折叠 " 方法预测的蛋白质结构精度不高,难以满足晶体数据解析的精度需要。而在腾讯 tFold 工具加持下得到的高精度 " 从头折叠 " 的结构模型,为分子置换方法提供相位,继而解析确定 2.8 原子级别精度的 SRD5A2 晶体结构。

这一结果能直接推进我们对体内 SRD5A2 活性失调引发的各类疾病的理解,进而为基于 SRD5A2 结构的药物开发提供更多有价值的参考信息。

《Nature Communications》的一位评审对此创新方法给予了高度评价:" 作者能用预测的分子置换(MR)模型来确定晶体结构,这一点非常有趣。本评审认为该技术确实非常出色,整个 X 射线晶体学界将从该方法中受益匪浅。"

《Nature Communications》期刊评审评论原文节选

tFold 工具突破蛋白质结构预测精度

腾讯 AI Lab 自研的 tFold 工具正是破解 SRD5A2 蛋白结构这一重要难题的关键。为了提升 " 从头折叠 " 方法(又称 " 自由建模 ")的精度,tFold 工具通过三项技术创新,实现了蛋白结构预测精度的大幅提升。

首先,实验室研发了" 多数据来源融合 "(multi-source fusion)技术,来挖掘多组多序列联配(multiplesequence alignment, MSA)中的共进化信息。

然后,借助 " 深度交叉注意力残差网络 " (deep cross-attention residual network,DCARN),能极大提高一些重要的蛋白 2D 结构信息(如:残基对距离矩阵)的预测精度。

最后,通过一种新颖的" 模板辅助自由建模 "(Template-based Free Modeling, TBFM)方法,将自由建模(Free Modeling, FM)和模板建模(Template-based Modeling, TBM)生成的 3D 模型中的结构信息加以有效融合,从而大大提高了最终 3D 建模的准确性。

在研究方面,tFold 平台已在国际公认最权威的测试平台 CAMEO 上证明其创新价值及有效性。腾讯 AI Lab 于 2020 年初在 CAMEO 平台注册了自动化蛋白结构预测服务器 tFold server,并自 2020 年 6 月起至今一直保持周度(图 1)、月度、季度、半年度冠军。

tFold server 在一般案例上领先业内权威方法 6% 以上,在困难案例上则领先 12% 以上。

在应用方面,tFold server 的公测版也已经在腾讯「云深智药」平台发布。用户可以手动输入待预测的氨基酸序列或从本地上传 FASTA 格式的序列文件。在经过一定时间的计算之后,用户即可得到使用 " 从头折叠 " 方法预测得到高精确度蛋白结构(下图)。

tFold server 的 3D Modeling 输出页面。左边部分为从头折叠得到的 3D 蛋白模型;右边部分是该 3D 模型在给定的预测残基对距离矩阵下的偏差。

腾讯「云深智药」用 AI 持续助力药物发现

依托大数据挖掘与机器学习等先进技术优势,腾讯正致力于推动 AI 与医疗产业的深度结合,助力社会整体医疗水平提升。

据雷锋网了解,「云深智药」是腾讯发布的首个 AI 驱动的药物发现平台,整合了腾讯 AI Lab 和腾讯云在前沿算法、优化数据库以及计算资源上的优势,致力于帮助用户大幅度减少寻找潜在活性化合物的时间和成本。

「云深智药」的五大模块覆盖临床前新药发现全流程,目前各功能模块正持续完善与升级。除蛋白质结构预测外,平台还上线了分子生成模块。

AI 驱动的分子生成模型是辅助小分子药物设计的重要工具之一,不仅能加速药物发现流程,还能启发药化专家跳出现有的分子库,探索更大的化合物空间。该模块还整合了 ADMET 属性预测功能,可对生成的新分子实时进行属性筛选。

此外,平台的逆合成算法也已取得了一定进展,计划于明年上线。其它小分子和大分子药物发现功能模块也将逐步上线。

除药物研发以外,腾讯 AI Lab 也在影像筛查、病理诊断等多个医疗领域持续探索,不断拓展和深化研究与应用。

在 AI 助力医疗技术方面,实验室联合多家合作单位研发了中国首款智能显微镜,帮助医生提高工作效率。2020 年 10 月,在免疫组化样本(IHC)分析的基础上,智能显微镜新增了针对宫颈液基细胞(TCT)标本进行临床样本的显微图像进行观察、筛选、标记功能,并已获得国家药监局审批证书。

在病理研究领域,腾讯 AI Lab 也研发出了世界领先的前沿算法,比如斩获 MICCAI 2020 CPM-RadPath 挑战赛第一名的算法,能够准确区分神经胶质瘤(大脑最常见肿瘤)的不同亚型并进行分级,有望弥补人工诊断效率低、主观因素影响较大等问题。

此外,腾讯 AI Lab 在今年早些时候与南方医院合作发表了名为《基于病理图片的结直肠癌微卫星不稳定性预测模型的开发和解释》的文章,利用算法模型可辅助病理医生筛查结直肠癌中微卫星不稳定亚型,降低微卫星不稳定筛查的条件要求,帮助更多的地方医院也有能力执行这样的筛查。

相关推荐