
单细胞其他组学数据分析空间转录组、表观组
——空间转录组、表观组 单细胞其他组学数据分析

上节回顾GENEONTOLOGYSeurat使用巩固Unifying BiologyCellChat:数据整合(批次效应矫正)reactome·差异基因富集分析GSEA·拟时序分析GeneSetEnrichmentAnalysisCelChatDB细胞通讯分析Ligand-ReceptorInteractionExplorerMSigDBMolecular SignaturesDatabaseMonocle3PlantPhoneDBAnanalysistooikitforsingle-cellRNA-segSEURATRtoolkitforsinglecell genomicsharmony>上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析
上节回顾 • Seurat使用巩固 • 数据整合(批次效应矫正) • 差异基因富集分析 • 拟时序分析 • 细胞通讯分析 • . 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析

上节回顾:10xVisiumVisium:在组织原位检测全转录组基因表达的一种技术,使得我们在检测基因表达水平的同时,获得基因在组织内部空间表达的位置信息。Visium平台由Spatialtranscriptomics技术发展而来。>将新鲜的冷冻组织切片成像,观察组织结构,将切片置于含有RNA捕获探针载玻片上。VisiumSpatialVisium GeneCapture Area withCELLSGeneExpression~5000BarcodedExpressionBarcodedSlideTISSUESpotsSpots对组织切片进行固定和透化,器三D16.5mm使RNA释放,结合相应的捕获探针。100μmPartiatRead1PolytdmstUM2222222299以捕获的RNA为模板合成55μmCDNA,制备测序文库,将制4992spots备好的文库上机测序并进行数据可视化。>上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析
上节回顾:10X Visium 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析

问题与分析内容空间转录组数据分析存在的问题问题分析内容标准化Normalization。如何将空间数据与表达数据关联在一起?·有了空间转录组数据,如何与单细胞转录组降维和聚类Dimensionalreductionand数据联用?clustering做了多层切片如何展示真实的三维空间的转检测空间可变特征Detectingspatially录本信息?variablefeatures交互式可视化lnteractivevisualization与单细胞RNA-seq数据的整合Integrationwithsingle-cell RNA-seqdata使用多个切片Workingwithmultipleslices>上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析
问题与分析内容 • 标准化 Normalization • 降维和聚类 Dimensional reduction and clustering • 检测空间可变特征 Detecting spatiallyvariable features • 交互式可视化 Interactive visualization • 与单细胞RNA-seq数据的整合 Integration with single-cell RNA-seq data • 使用多个切片 Working with multiple slices 问题 分析内容 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 • 如何将空间数据与表达数据关联在一起? • 有了空间转录组数据,如何与单细胞转录组 数据联用? • 做了多层切片如何展示真实的三维空间的转 录本信息? • 空间转录组数据分析存在的问题

Seurat分析10xVisium数据(1)数据来源:小鼠脑切片,有两个连续的前部切片和两个(匹配的)连续的后部切片O brain54 [31053 × 2696] (Seurat:Seurat 54 cbject of dass Seura9O.8558/5istuiListotlerSpatial54 [31053± 2605] (Seurat-Astaj) S4 objact of dams Asa)Seurat中存储空间数据的格式:Ocourt54 [31053 x 2696] (MatricdgCM $4 object of dass dgCMatriOdas54 [31053 r 2695] (Matra-dgCM $4 obiect af dams dgCMabtGene-spot表达矩阵(spot可能包含多个细胞)scale.datadouble [0 × 0]keychascter [1]'spatial,'数据采集时通过HE染色获得的组织切片图像NULLPairist f length oasay.arigvarfestureslogicsl 10]将原始高分辨率图像与用于可视化的低分辨率图像关联的缩放因子Sst [31053 0] (53: data.trame)with 31053 rows and 0 columnimetafeaturesAdaMJLLPuirist of lenothoO retadatalint [2696 × 5] ($3: deta.hame)Adaaframswith2506rownand5colmractive.assaycharacter [T]Spatal>brainfactarOactiveidentFactor wit1 lewt:anteriorgraphe1ist []Lst of length oAn object of class Seuratnightenfe 101Lintoflengho31e53 features across 2696 samples within 1 assayst (0]stokomagnin3]Lit of lengthActive assay: Spatial (31e53 features, e variable features)Oanteriori54 [599 × 600] (Seueat:VsiumV1) 54 otbject of dass VitiumV1 image present:anterior1imagedouble (599 x 600 x3)0.722 0.722 0.722 0.718 0.718 0.718 0.722 0.718 0.722 0.722 0.718 0.718. 0.722 0.,Oscale/astorsint [4] (S3:scalelactors)Lat of length 40172117spotdouble (7]brain@assayssSpatial[1:4,1:4]Eiducialdeuble 11]144.5412>hires0.172117double [1]4 x 4 sparse Matrix of class "dgCMatrixlowresdouble 110.05163511O coordinateslist [2696 × 5] (53: dataframe)A.data.frame with 2696 abws and 5 columrsAAACAAGTATCTCCCA-1 AAACACCAATAACTGC-1 AAACAGAGCGACTCCT-1 AAACAGCTTTCAGAAG-10.012439spotradiusdouble (1]Xkr4..character [1]Spatalassayketerior1character (t)Gm1992..projectnamecharactar [1]"anteriorGm37381*.1s0-mis:tistof ength oOvenionRp1Sit [1] (S3: packagx,venn, nurr Lint ef length .1st 0commandsList of iength otooisfiet [0]Lit ef length 0上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析>
Seurat 分析 10X Visium 数据 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 (1)数据来源:小鼠脑切片,有两个连续的前部切片和两个(匹配的)连续的后部切片 Seurat 中存储空间数据的格式: • Gene-spot表达矩阵(spot可能包含多个细胞) • 数据采集时通过HE染色获得的组织切片图像 • 将原始高分辨率图像与用于可视化的低分辨率图像关联的缩放因子 > brain An object of class Seurat 31053 features across 2696 samples within 1 assay Active assay: Spatial (31053 features, 0 variable features) 1 image present: anterior1 > brain@assays$Spatial[1:4,1:4] 4 x 4 sparse Matrix of class "dgCMatrix" AAACAAGTATCTCCCA-1 AAACACCAATAACTGC-1 AAACAGAGCGACTCCT-1 AAACAGCTTTCAGAAG-1 Xkr4 . . . . Gm1992 . . . . Gm37381 . . . . Rp1 . . .

Seurat分析1oxVisium数据(1)数据来源:小鼠脑切片,有两个连续的前部切片和两个(匹配的)连续的后部切片心idrtidermsorahsorpceiriotnCount_SpatialnCount_SpatialnCount SpatialnCount_Spatial600008000600005000040000400004000040000-artenorposterior22000020000200002000031053features31053features31053features31053features2696samples2825samples3353samples3293samplesIdentityIdentityIdentityIdenfty上节回顾空间转录组数据分析单细胞甲基化数据分析单细胞ATAC数据分析
Seurat 分析 10X Visium 数据 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 (1)数据来源:小鼠脑切片,有两个连续的前部切片和两个(匹配的)连续的后部切片 31053 features 2696 samples 31053 features 2825 samples 31053 features 3353 samples 31053 features 3293 samples

Seurat分析10xVisium数据(2)预处理:标准化消除测序深度的影响(与处理scRNA-Seq数据类似)组织的细胞密度在空间上存在差异的话,会导致spot之间巨大的异质性(不同spot的分子计数的差异不仅是技术上的,还取决于组织解剖学)标准化方法(LogNormalize函数)强制每个spot具有相同的文库大小,这可能会带来误差建议使用sctransform构建正则化的负二项基因表达模型brain上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析
Seurat 分析 10X Visium 数据 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 (2)预处理:标准化消除测序深度的影响(与处理scRNA-seq数据类似) • 组织的细胞密度在空间上存在差异的话,会导致spot之间巨大的异质性(不同spot的分子计数的差异不仅是技术上的,还取决于组织解剖学) • 标准化方法(LogNormalize函数)强制每个spot具有相同的文库大小,这可能会带来误差 • 建议使用sctransform 构建正则化的负二项基因表达模型 brain <- SCTransform(brain, assay = "Spatial", verbose = FALSE) # 注意这里的默认参数:variable.features.n = 3000(默认选择的是3000个高变基因)

Seurat分析1oxVisium数据(2)预处理:标准化消除测序深度的影响(与处理scRNA-Seq数据类似)SCTransform与LogNormalize两种标准化方法之间的差异:计算每个基因与nCountSpatial数量的相关性,根据基因的平均表达水平将其分组,发现LogNormalize(左)的前三组基因表达与nCountSpatial相关性较强(即没有充分标准化基因表达值)SCTransform NormalizatioLogNormalizatiorgrpgrp串(1.92,2.88車(1.92,2.68ne0+-000390.959电2000039电1-0.006-0.00330电40.966-0.00339- (-1.93,-0.96电(1.93,0.966中(-2.891.80)审4-2.89-1.9303上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析
Seurat 分析 10X Visium 数据 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 (2)预处理:标准化消除测序深度的影响(与处理scRNA-seq数据类似) • SCTransform 与 LogNormalize 两种标准化方法之间的差异:计算每个基因与 nCount_Spatial 数量的相关性,根据基因的平均表达水平将 其分组,发现LogNormalize(左)的前三组基因表达与 nCount_Spatial 相关性较强(即没有充分标准化基因表达值)

Seurat分析1oxVisium数据(2)预处理:基因表达的可视化(对于小鼠大脑数据,Hpca是海马体的标记基因,Ttr是脉络丛的标记基因)pt.size.factor:缩放绘图斑点的大小pt.size.factor=1pt.size.factor=2pt.size.factor=2.5上节回顾>空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析
Seurat 分析 10X Visium 数据 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 (2)预处理:基因表达的可视化(对于小鼠大脑数据,Hpca是海马体的标记基因,Ttr是脉络丛的标记基因) • pt.size.factor:缩放绘图斑点的大小 pt.size.factor = 1 pt.size.factor = 2 pt.size.factor = 2.5

Seurat分析1oxVisium数据(2)预处理:基因表达的可视化(对于小鼠大脑数据,Hpca是海马体的标记基因,Ttr是脉络丛的标记基因)alpha:设置最小和最大的透明度,可以将表达较低的点设置为更透明alpha = 0.9alpha = c(0.1, 1)上节回顾空间转录组数据分析单细胞ATAC数据分析单细胞甲基化数据分析>
Seurat 分析 10X Visium 数据 上节回顾 空间转录组数据分析 单细胞ATAC数据分析 单细胞甲基化数据分析 (2)预处理:基因表达的可视化(对于小鼠大脑数据,Hpca是海马体的标记基因,Ttr是脉络丛的标记基因) • alpha:设置最小和最大的透明度,可以将表达较低的点设置为更透明 alpha = 0.9 alpha = c(0.1, 1)