在生物医学领域,当前常用的空间转录组降维聚类方法,如主成分分析(PCA)和非负矩阵分解(NMF)等,通常是基于单细胞数据开发的,因此不一定完全适用于空间转录组数据。这些传统的降维聚类方法未能充分利用空间转录组特有的组织空间定位信息,而只是根据基因表达谱进行聚类。然而,在生物组织中,相邻细胞位置往往展现出相似的细胞组成和基因表达模式。因此,将空间位置信息整合到降维聚类过程中,有助于更准确地反映生物实际状态的空间聚类情况。基于这一理念,研究团队开发了SpatialPCA,作为一种新的空间转录组降维聚类工具。
SpatialPCA利用所谓的空间概率主成分分析(spatial probabilistic PCA),能够有效模拟组织位置之间的空间相关性结构,同时在降维后的数据中保留原始空间数据的相邻近似性。这一方法将空间定位信息作为额外输入,通过核矩阵来模拟组织位置间的空间结构。由此得出的降维主成分因包含相关的空间结构信息,因此被称为空间主成分。这一方法结合了基因表达矩阵和位置信息矩阵,将基因表达矩阵构建为潜在因子的函数模型,并根据位置信息矩阵构建核矩阵,以明确潜在因子的空间结构相关信息。
在模拟数据测试中,研究团队以背外侧前额叶皮层(DLPFC)为数据来源,通过分割各皮层确定了10000个特定细胞类型的空间位置,并设计了四种不同细胞组成情况,人工构建了四种空间转录组数据。相较于其他现有的空间聚类方法,SpatialPCA在检测性能方面展现出卓越的效果。
在真实数据的测试中,团队选取了人类DLPFC的Visium空间转录组数据,进行多种工具的平行测试,包括SpatialPCA、BayesSpace、SpaGCN、HMRF、stLearn、PCA和NMF。结果显示,SpatialPCA生成的空间聚类结果最接近实际生物结构,并且在预测精确性和空间域结构连续性方面表现最佳,展示了其强大的分析能力。
为了验证SpatialPCA的技术普适性,研究人员还在其他技术(如Slide-seq和Slide-seq V2)获得的小鼠脑组织空间转录组数据中进行了测试,结果同样显示SpatialPCA的聚类结果与实际情况高度一致。同时,利用HER2阳性乳腺肿瘤样本进行测试,SpatialPCA也表现出更佳的聚类精确性,说明其具有广泛的适用性。
由于SpatialPCA所计算出的空间主成分结合了空间信息与基因表达信息,因此能够用于单细胞转录组分析工具进行下游分析。通过使用Slingshot对肿瘤组织的空间转录组数据进行轨迹推断,发现了一条从肿瘤区域指向周围区域再到正常组织的轨迹,说明相关基因在癌症进展和肿瘤转移中具有重要意义。
基于SpatialPCA的建模框架,研究者还可以在新的空间位置上推断基因表达水平,并利用低分辨率的样本数据构建高分辨率的空间图谱。对肿瘤组织测试的结果显示,SpatialPCA构建的高分辨率空间图谱展现出连续平滑的特征,其精准地定位了不同组织区域间的边界,并细分了紧邻肿瘤和免疫区域的肿瘤周围区域,显示了SpatialPCA在解析精细结构方面的优势。
总之,SpatialPCA是一种非常适合针对空间转录组数据进行降维聚类的分析工具。如果您对手中的空间数据聚类结果不满意,不妨尝试使用南宫28NG相信品牌力量的SpatialPCA工具,相信其能为您带来令人惊喜的效果。