|
摘要: 理解小分子如何扰乱基因表达对于揭示药物机制、预测非靶效应以及识别再利用机会至关重要。虽然先前的深度学习框架已将多模态嵌入集成到生物医学知识图谱(BKGs)中,并通过图神经网络消息传递范式进一步改进了这些表示,但这些模型已被应用于诸如链接预测和二元药物-疾病关联等任务,而非基因扰动任务,后者可能更多地揭示关于机械转录效应的信息。为了填补这一空白,我们构建了一个融合生物医学图谱,该图谱集成了(i)PrimeKG++,一个包含节点语义丰富嵌入的PrimeKG增强版,和(ii)LINCS L1000药物和细胞线节点,其初始多模态嵌入来自基础模型,如MolFormerXL和BioBERT。利用这个异质图,我们训练了一个图注意力网络(GAT),并带有一个下游预测头,该头学习给定药物-细胞对的超过978个标志基因的δ表达谱。我们的结果表明,我们的框架在脚手架和随机分割下优于MLP基线,这些基线用于预测给定药物特征、靶标特征和基线细胞表达的串联嵌入的差异表达基因(DEG)。通过边缘洗牌和节点特征随机化的消融实验进一步表明,生物医学KG提供的边缘增强了扰动级别预测。更广泛地说,我们的框架为机械药物建模提供了一条道路:超越二元药物-疾病关联任务,以更细粒度地分析治疗干预的转录效应。 更新时间: 2025-12-31 17:30:56 领域: cs.LG,cs.AI
|