CGM第342期:基于图自监督学习的药物发现

生物制药相关,包括biotech和pharma,股票分析,工作内推,简历评估,职业规划,研发交流,FDA资讯等

版主: Tlexander

回复
Tlexander楼主
论坛点评
论坛点评
帖子: 2736
注册时间: 7月 22, 2022, 5:34 pm

CGM第342期:基于图自监督学习的药物发现

帖子 Tlexander楼主 »

DeepR2cov这页中,Molecular docking的准确度一般在什么level?
token和sentence的建立是如何考量的?是否有alternative的方式?sentence的长度是怎么确定的?
元路径的设计是基于生物学知识吗?网络中的不符合生物学知识的元路径有吗?
ATC classification的数据来源是?是否有R/package 做这个事情?
atc预测中,如果用一个药物多个ATC的标签,有什么好的解决方法?谢谢。
能否分享一些DeepR2cov中常见的false positive及 false negative的例子?以及可能的原因?
16种元径对模型performance的影响是否有evaluation?是否有importance的ranking?
Simcon的设计思路是不是和对比学习的思想是类似的呢?
这就是相当于设计了6个代理任务 然后一起训练GAT吗?
你好 第三个工作的重点就是做自监督多任务的组合吗 所应用的下游任务只有这一个吗?
元路径的embedding方法也是直接用的GAT吗? 是否可以用了异构图相关的方法吗?
您发现的两个化合物有查阅过专利情况吗?化合物和已知活性化合物结构相似情况是怎么样的?
为什么选择自监督图学习,而不是有监督的图学习?
新冠的药物重定位中,先选择了IL6和TNFalpha两个新冠候选靶标,然后去找候选药物,这样可能会极大限制新冠药物发现的方向。能否直接找新冠-药物对?
欢迎大家关注公众号cgmonline, 欢迎大家加入cgm志愿者,促进cgm持续发展。
不同多任务组合在下游任务的评估方式是线性判别还是其他方式呢?
就是将不同自监督任务学习到的embedding做拼接 然后直接送到DDI和DTI预测吗? 是否有考虑自监督任务与下游任务共同训练和优化呢?
时间因素,问题到此截止哈。
Tlexander楼主
论坛点评
论坛点评
帖子: 2736
注册时间: 7月 22, 2022, 5:34 pm

Re: CGM第342期:基于图自监督学习的药物发现

帖子 Tlexander楼主 »

王小奇,湖南大学2019级博士生。研究方向是生物信息,自监督学习、深度学习、药物发现。主持湖南省科研创新项目一项,参与研发科技部重点研发计划、国家自然科学基金联合重点项目等科研项目,获得2019年浙江省优秀硕士学位论文奖,在Nature Machine Intelligence,Bioinformatics, Briefings In Bioinformatics, IEEE/ACM TCBB等期刊会议发表论文数篇,授权发明专利12项,开发的DeepR2cov和BioERP等药物发现平台在国家基因组科学数据中心被下载2260余次,被评为国家重点研发计划项目亮点成果。
内容摘要

传统的药物研发周期长、费用高,成功率较低。近些年来,面向生物医学网络的图深度学习技术在药物发现领域中显示出了广阔的前景。然而,生物医学数据的稀疏性和高度复杂性限制了图深度学习技术在特定药物发现中的性能。因此,基于图自监督学习的药物发现方法应运而生。首先,充分探索发现了生物医学网络的多枢纽结构特点,基于该结构特点提出了路径驱动的自监督表征模型DeepR2cov和BioERP,并在药物ATC分类、抗COVID-19药物重定位、疾病基因预测等任务中取得了良好的预测精度。其次,在多任务学习的框架下,从生物医学网络的结构、语义、属性等多个角度出发,设计了一系列自监督任务以及多任务驱动的图深度表征模型,生成高质量的生物实体特征,进一步提高药物发现的预测性能。
回复

回到 “生物制药(Pharmaceutical)”