整合多组学数据,华大基因团队图神经网络模型SpatialGlue登Nature子刊-人工智能

首页 2024-07-03 18:35:49

编辑:KX

空间转录组学与多组学数据集成

空间转录组学作为单细胞转录组学后的重大进展,使多组学数据的整合至关重要。

SpatialGlue:具有双注意力机制的图神经网络模型

新加坡科技研究局来自新加坡科技研究局(A*STAR)、上海交通大学医学院附属仁济医院的华大基因和研究小组提出了一个名字 SpatialGlue 对于图神经网络模型,该模型通过双重注意机制整合多组学数据,以空间感知的形式揭示组织样本的组织学相关结构。

SpatialGlue 的优势

SpatialGlue 它可以将各种数据模式与各自的空间背景相结合。与其他方法相比,SpatialGlue 具有以下优点:

  1. 捕获更多解剖细节。
  2. 更准确地分析空间域(如大脑皮层)。
  3. 在不同区域(如脾巨噬细胞亚群)识别细胞类型。

空间组学分析的强大工具

该研究突出了多模态空间组学在分析生物复杂性方面的强大能力。

相关研究

“相关研究”Deciphering spatial domains from spatial multi-omics with SpatialGlue”为题,于 6 月 21 日发表在《Nature Methods》上。

空间多组学数据集成面临挑战。目前,空间技术正在扩展到空间多组学,即在单个组织切片上分析不同的组学。这些技术大致可以分为两类:基于测序和成像。有可能深入了解细胞和新兴组织的特征。
为了充分利用空间多组数据构建研究组织的连贯图像,需要对异构数据模式进行空间感知整合。多组数据集成面临着巨大的挑战,因为不同模式的特征计数可能存在巨大的差异和不同的统计分布。当空间信息与每个数据模式中的特征计数相结合时,这一挑战就更加严峻。
目前,还没有专门为从同一组织中获得的空间多组学设计的工具。因此,有必要专门为空间多组学数据量身定制的工具来应对整合空间多组学数据进行下游分析的挑战。特别是,需要一种新的空间感知跨组学集成的方法。
SpatialGlue Spatialglue模型结构 将多组学模态数据与空间信息有效结合,以更高的分辨率解读组织样本的空间域。SpatialGlue 基于图神经网络的一种 (GNN) 深度学习模型。
SpatialGlue 首先使用 k 最近邻 (KNN) 算法,利用空间坐标构建空间邻居图,并利用各组学模态的归一化表达数据构建特征邻居图。
然后,对于每个模态,GNN 编码器采用集成表达和邻居图,通过迭代聚合邻居的表达来学习两个特定的图表。为了捕捉不同图片的重要性,设计了一个模式中的聚合层,以适应地集成特定的图片表示,并获得特定的模式表示。
最后,为了保持不同模式的重要性,SpatialGlue 注意聚合层在使用模态之间适应地集成特定于模态的表示,并输出最终的斑点集成表示。

图表:可解释深度双重注意模型,用于空间多组学数据分析。(来源:论文)评估提出的 SpatialGlue 对于模型的有效性,研究人员首先通过一系列消融研究验证了注意力和其他组件的重要性。然后,表征 SpatialGlue 分析输入的邻居数量和主要成分(PCA)维度以及 GNN 层数的敏感性。
分辨率较高,捕获更多解剖细节的研究人员首先测试了模拟和实验获得的人类淋巴结数据 SpatialGlue,并进行了基准测试。SpatialGlue 定量性能优于其他方法,并捕获了更多的解剖细节。
定量基准测试表明,SpatialGlue 在 5 模拟数据集和 12 真实数据集的表现优于 10 单模式和非空间方法最先进的性能凸显了空间信息和跨组学整合的重要性。

1. 图示:SpatialGlue 在真实数据中准确识别模拟和空间域。(来源:论文)
  1. 接下来,将 SpatialGlue 与原始研究相比,小鼠大脑表观基因组转录组的数据集揭示了更精细的皮层,可以进一步研究更高空间分辨率的基因调节。

    图示:SpatialGlue 小鼠大脑样本以较高的分辨率解剖空间表观基因组转录组。(来源:论文)

最后,进一步 SpatialGlue 应用于 Stereo-CITE-seq 和 SPOTS 获取的数据证明,它广泛应用于各种技术平台。研究人员测试了八种方法。总体而言,SpatialGlue 在 Jaccard 相似性得分最高,相似性得分最高 Moran's I 在评分中排名第二。另外三个小鼠胸腺切片被用来进一步复制这种优异的性能。

研究人员说:「我们相信 SpatialGlue 它将成为现在和未来空间多组学数据的宝贵分析工具。SpatialGlue 还有很多可能的扩展方式。其中一个是以图像为模态。我们计划扩展 SpatialGlue,注意在模态或模态之间合并图像数据。我们还计划通过整合从连续组织切片中获得的多组学数据来扩展 SpatialGlue 的功能。」

注:封面来自网络

以上是华大基因团队图神经网络模型SpatialGlue在Nature子刊上整合多组学数据的详细内容。请关注其他相关文章!


p