为已知药物发现新用途在药物发现中起着至关重要的作用。然而,生物实验室广泛使用的生化实验方法昂贵且耗时,延缓了药物发现的进度。对廉价、有效和快速预测方法不断增长的需求推动了计算方法的发展,这些方法提供了一种更便宜、更快速的方法来预测药物和标靶之间的潜在相互作用。杭州电子科技大学学生阮定题为《Exploring Complex and Heterogeneous Correlations on Hypergraph for the Prediction of Drug-Target Interactions》的论文,采用深度学习方法更加准确地预测药物和标靶间的潜在相互作用,为已知药物发现新的作用。这篇论文已被《Patterns》期刊接收,为Cell子刊。
最传统的计算方法需要知道准确的3维蛋白质结构才能进行预测,这不利于展开大规模的药物发现实验。考虑到一种药物可能与多个标靶存在相互作用(即所谓的多标靶药物,可以针对各种复杂的疾病,它们广泛存在且有效),这些标靶可能共享微妙但重要的药理学特征。当进一步考虑更多的联系时,例如药物-疾病关联和标靶-疾病关联,需要考虑的关联变得更加复杂,并以多对多的模式出现。为了解决这个问题,我们采用了一种基于异质超图的模型来探索复杂的异质关联以预测药物和标靶间是否存在相互作用。
药物、标靶、疾病等生物医学实体之间的关系极为复杂,简单地用一个网络难以表示他们之间的异质关系。考虑到标靶和药物之间的高阶(多对多)相关性,为此,我们将与同一个药物产生相互作用的标靶视为一个集合,类似地,将与同一种疾病产生关联的标靶同样视为一个集合,利用深度学习方法,为药物和标靶分别寻找合适的向量表示。通过比较向量表示之间的相似度,便能够预测药物和标靶之间是否存在相互作用。实验证明,基于高阶相关性建模的表示可以显著提高药物标靶相互作用的预测性能。
这个模型的亮点有两个,一是关注到药物和标靶相互作用间的多对多关系,二是证明了疾病相关信息有助于药物-标靶相互作用预测。更重要的是,药物和标靶间的相互作用预测本质上是链路预测问题,我们希望其他领域的链路预测问题的研究者同样注意到网络中的高阶关联。
阮定同学系我校自动化学院智能信息处理实验室成员,该实验室由颜成钢教授领衔,与美国北卡罗来纳大学教堂山分校、美国中佛罗里达大学、澳大利亚悉尼科技大学、中国科学院、清华大学等国内外多家高校和科研院所有长期密切的合作,近年来培养出多名优秀学生。正是因为得到了全世界领域内知名学者的指导,实验室学生的研究成果近年来呈现井喷之势。此论文的工作也得到了清华大学软件学院高跃副教授和其他同学的很多指导和帮助。
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学