
单细胞转录组数据分析从原始数据到细胞类型注释
——从原始数据到细胞类型注释 单细胞转录组数据分析

natureConstructionofahumancelllandscapeatsingle-cell人类细胞图谱levelAdult adiposeAdultthyroidglandAdult adrenal glandAdulttracheaAdult arteryeAdulttransversecoloneAdultascendingcolonAdultureterAdultbladderAdult uterus1822AdultbonemarrowChorionicvillusFetalstromalcellAdult cerebellumCordbloodAdultcervixCordbloodCD34P11AdultduodenumFetal adrenal glandAdult epityphlonFetal brainAdultoesophagusepithelialcellFetal calvariaAdultfallopian tube7FFetal eyesAdult gall bladderENFetal femalegonad46AdultheartFetal heartAdult ileumAdOEndotheliailFetal intestineAdult jejunumFetalkidneyAdult kidney89%oFetal liver8Adult liver10057Fetal lung18Adult lungFetal malegonad14Adultmuscle2FetalmuscleAdultomentumFetalpancreasAdultpancreas50Fetal ribAdultperipheralblood32Fetal skinAdultpleuraFetal spinal cordAdultprostate97FetalstomachAdultrectumAdultsigmoidcolonFetal thymusMacrophageAdultspleenHumanEScells91AdultstomachNeonataladrenalglandAdulttemporal lobePlacentat-SNE1c>简介》实例分析原始数据处理表达矩阵处理和可视化细胞类型注释
人类细胞图谱 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析

为什么要进行单细胞研究?·没有完全相同的两片树叶无法区分以下情况Western BlotPCRbulkRNAseqsingle-cell RNAseqorgan/tissueSteinheueretal.,bioRxiv,2021https://mp.weixin.qq.com/s/5laEGHM2iWSLRuOiaBbr7Q>简介原始数据处理表达矩阵处理和可视化细胞类型注释实例分析
为什么要进行单细胞研究? • 没有完全相同的两片树叶 Steinheuer et al., bioRxiv, 2021 https://mp.weixin.qq.com/s/5laEGHM2iWSLRu0iaBbr7Q • 无法区分以下情况 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析

C单细胞转录组测序技术比较High scoreLowscoreo·综合比较结果score100rkingUMIStrandMethodsTranscriptReferences2specificcoveragepossibility.NoTang methodNearlyNoTang et al., 2009Be-Methodfull-lengthNoNoFull-lengthQuartz-SeqSasagawa:et-al., 2013Quartz-seq2NoNoSUPeR-seqFull-lengthFan X. et al., 2015ChromiumNoNoSmart-seqFull-lengthRamskold et al., 2012NoNoSmart-seq2Full-lengthPicell et al., 2013Smart-seq2YesFull-lengthYesMATQ-seqSheng et al., 2017CEL-seq2YesYesSTRT-seq5'-onlyIslam et al., 2011, 2012andSTRT/C1C1HT-mediumYesYesCEL-Seq3'-onlyHashimshory et al., 2012C1HT-small3'-onlyYesYesCEL-seq2Hashimshony et al., 2016福YesYes:MARS-Seq3'-onlyJaitin et al., 2014ddSEQ83'-onlyYesYesCytoSeqFan.H.C:et al., 2015Chromium (sn)?YesDrop-seq3'-onlyYesMacosko et al., 2015Drop-seqoYesYesOInDrop3'-onlyKlein et al., 2015?YesYesChromium3'-onlyZheng et al., 2017inDrop??YesSPLIT-seq3'-onlyYesRosenberg et al., 2018ICELL8.福3'-onlyYesYes?sci-RNA-seqCao et al., 20173'-onlyYesYesSeq-WellGierahn et al., 2017MARS-seqo..YesYes:DroNC-seq3'-onlyHabib et al., 2017gmcSCRB-seqC..3'-onlyYesYesQuartz-Seq2Sasagawa et al., 2018Mereuetal.,NatureBiotechnology2020Chen et al.,Frontiers in Genetics.2019>简介原始数据处理表达矩阵处理和可视化细胞类型注释实例分析
• 综合比较结果 Mereu et al., Nature Biotechnology , 2020 Chen et al., Frontiers in Genetics. 2019 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析 单细胞转录组测序技术比较

单细胞转录组测序微流控TheChromiumSingleCellGeneExpressionSolutionPooRTCollectRemoveOilt.0.-Oil10xBarcodedGel BeadsCellsEnzymeGelBeadTruSeq Read 1PolyidTWNSingle Cell10xBarcoded10xBarcodedMCDNAGEMSCDNANextera Read.1(Read 1N)CaptureSenSingle Cell3'10xUMIv3.1Gel BeaddedatPrimersNexfera Read T(Read 1N)uneseg:TOUMIhttps://www.10xgenomics.com>简介原始数据处理表达矩阵处理和可视化细胞类型注释实例分析
7 单细胞转录组测序 • 微流控 The Chromium Single Cell Gene Expression Solution https://www.10xgenomics.com 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析

单细胞转录组测序Single-Cell Capture WorkflowsingleCellCopture WorklowLoad CellsLoad.575 ul cellsuspension.Lood Celt微孔板BDRhapsody Clogging of chonnels are not a concern as there are nomicrofluidic channelsCril Load Scar?Gentlesetting of cells by grovity ollows cuptute-oMicrowelltechnologyfragile celisThe BD Rhopsody Cartridge contains >220,000 paititions-No.sampleloss dueto clogging ofchannelsVisualworkflowQcforcapture af up to 40,000 cells otalow multiplet rate-Noelectronics.portableConfidencewethevery experiment2 Load Beodsfe Cell LoadScan575uLcellssuspensionloadingvolume2aBeod Lood andEstimate the number of viable cels captured and the celBead Weih Scanmultiplet rate2Load BeadsLowmultipletrate%cartridge, Geometry and dimension of the microwell prevents2-3%@10.000cellload80Uptocaptureratebead multiplets8-10%@40000celloadCelftysis3forcertainceltypes Bead Load and Bead Wash ScanEstimnate the number of wells with-a vioblecell and a bead.Meosure cellretention rote to assess if cellshavebeen lostCaptureandanalyzefragilecellsBroad range ofcellthroughputCell Lysis&Beod RetrievolGranulocytes,neutrophils,CAR-Tcells,stem.cellsStronglysisbuffers ensurecompletelysisof cellscells per100-40,000tumorxenogratderivedcells,myelomacellsnCartridgeBead RetrievalNK cells andmoreEasy, efficient mognetic retrieval of.beadsBeod Retrievol calSaBead Retrieval ScanConfirm complete retrieval of beadsMinimalbatcheffects*0+oHighcorrelationwithflowdataScDNASynthesisConssnt,liabsutsw全?ThesametrustedBDantibodiesYYYMultiple bead woshes remove contaminants-and allow fortechnicabiologicatste-to-siteandfoeflowandsingle-cell multiomics0+0user-to-userreplicatesmore effectivereverse transcriptionCDNA SymthesisBeads can be archived or subsampled for moreexperimentalflexibilityLibrary Preparation, Sequencing and AnalysisSubsamplebeadsArchivebeadsDBioinformatics solutions inicluding theBD Rhapsody"FlexibatywithexperimentaldesignEquivalentdata obtainedframfreshbeads ancAnalysis Pipelinesand SegGeq"Software provide.acompletetooltomeasurerellability,beadsstored forseveralmonthsend-to-end single-cel solutionworkwith.collaboratorsLibrery Preporotiun, Serquencing and Analyeshttps://www.bdbiosciences.com>简介细胞类型注释原始数据处理表达矩阵处理和可视化实例分析
简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析 • 微孔板 BD Rhapsody https://www.bdbiosciences.com/ 单细胞转录组测序

PRE-PROCESSINGDOWNSTREAMANALYSES单细胞转录组数据分析流程:前处理Pre-processing质控Qualitycontrol·标准化Normalization特征基因选择Feature selection·降维Dimensionalityreduction.聚类Clusteranalysis细胞类型注释Celltypeannotation数据整合Dataintegration·拟时分析Trajectoryanalysis·差异基因分析·细胞通讯>简介实例分析原始数据处理表达矩阵处理和可视化细胞类型注释
9 单细胞转录组数据分析流程 • 前处理 Pre-processing • 质控 Quality control • 标准化 Normalization • 特征基因选择 Feature selection • 降维 Dimensionality reduction • 聚类 Cluster analysis • 细胞类型注释 Cell type annotation • 数据整合 Data integration • 拟时分析 Trajectory analysis • 差异基因分析 • 细胞通讯 • . 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析

单细胞转录组数据分析方法,不同种类,涉及到不同的分析步骤12345tools,32categories40%(202310001)https://www.scrna-too/s.org/0>简介原始数据处理表达矩阵处理和可视化细胞类型注释实例分析福
10 单细胞转录组数据分析方法 • 不同种类,涉及到不同的分析步骤 https://www.scrna-tools.org/ 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析 12345 tools, 32 categories (202310001)

从FASTQ到表达矩阵Count MatrixBCL filesCell2CelINCelllGenet3213231Gene2Signal Processing11418Gene3QCofCountMatrix".Sequencing Reads.*0025GeneMl4QCofFASTQ>readCGGTAGCCAGCTGCGTTCAGTASplicedAlignmentCount assignment+&&-&%$%%$$$#)33&0$&%Sto genome>Bread4CGGTAGCCAGCTGCGTTCAGTAUMI resolution+&&-&%$%%$$#)33&0$&%S"Alignment>@read 3CGGTAGCCAGCTGCGTTCAGTA+&&-&%$%%$$#)33&0S&%S"*Lightweight mappingCB correctionto(extended)txomeFASTQFileQuantification>简介>原始数据处理实例分析表达矩阵处理和可视化细胞类型注释
11 从FASTQ到表达矩阵 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析

原始数据格式(FASTQ)@ST-E00126:128:HJFLHCCXX:2:1101:7405:11331:N:0:CTTGTAGATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT+!/1*((((***+))%%%++)(%%%%).1***-+*1))**55CCF>>>>>>CCCCCCC65第1行主要储存序列测序时的坐标等信息;第2行就是测序得到的序列信息,一股用ATCGN来表示,其中N用于荧光信号干扰无法判断到底是哪个碱基时的代表符号第3行以“+”开始,可以储存一些附加信息,但目前的测序fastq文件这一行一般是空的。第4行储存的是质量信息,与第2行的碱基序列是一一对应的,其中的每一个符号对应的ASCIl值是经过换算的phred值,可以简单理解为对应位置碱基的测序质量值,越大说明测序的质量越好。不同的版本对应的phred值范围不同。12>简介原始数据处理>细胞类型注释》实例分析表达矩阵处理和可视化>
12 原始数据格式(FASTQ) 简介 原始数据处理 表达矩阵处理和可视化 细胞类型注释 实例分析 @ST-E00126:128:HJFLHCCXX:2:1101:7405:1133 1:N:0:CTTGTA GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT + !''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65 第1行主要储存序列测序时的坐标等信息; 第2行就是测序得到的序列信息,一般用ATCGN来表示,其中N用于荧光信号干扰无法判断到底是哪个碱基时的代表符号; 第3行以“+”开始,可以储存一些附加信息,但目前的测序fastq文件这一行一般是空的。 第4行储存的是质量信息,与第2行的碱基序列是一一对应的,其中的每一个符号对应的ASCII值是经过换算的phred值,可以 简单理解为对应位置碱基的测序质量值,越大说明测序的质量越好。不同的版本对应的phred值范围不同