普通高等教育 “十三五”规划教材 Bioinformatics Thi时i 生物信息学 生物信息学 Bioinformatics 司#年,长上 O0队非编码RNA0心 01/29,2019 邵朝纲、陈铭
非编码RNA 01/29, 2019 邵朝纲、陈铭 普通高等教育 “十三五”规划教材 生物信息学 Bioinformatics
Wing Ches'4 Group of Bioinformatics @College of Life Science,Zhejiang University 000八 1.细胞内的RNA类群 RNA Coding Non-coding RNA RNA >200nt mRNA Translation related Short non-coding Long non-coding RNAs RNA CircRNA RNA rRNA tRNA siRNA miRNA piRNA snRNA snoRNA Integenic Intronic LneRNA LneRNA 非编码RNA的分类 I.形状和长短:环状RNA,线性RNA(短非编码RNA和长非编码RNA) 2.细胞内的分布:核仁小RNA,核小RNA,细胞质小RNA,Cajal小体 3.功能和表达特征:看家ncRNA,调节ncRNA,看家和调节ncRNA 2
1.细胞内的RNA类群 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 2 1.形状和长短:环状RNA,线性RNA(短非编码RNA和长非编码RNA) 2.细胞内的分布:核仁小RNA,核小RNA,细胞质小RNA,Cajal小体 非编码RNA的分类 3. 功能和表达特征:看家ncRNA, 调节ncRNA, 看家和调节ncRNA
WigChe'4 Group of Bioinformatics @College of Life Science,Zhejiang University 00队 2.非编码RNA的识别 理论预测 实验检测 已知ncRNA提取特征,进行搜索 构建ncRNA的cDNA文库,克隆测序 snoScan,snoGPS,tRNAScan, mirScan,RNAz,RNAmotif等软件 分离纯化ncRNA直接测序 全基因组tiling array芯片技术 3
理论预测 已知ncRNA 提取特征,进行搜索 snoScan, snoGPS, tRNAScan, mirScan, RNAz, RNAmotif等软件 实验检测 构建ncRNA的cDNA文库,克隆测序 分离纯化ncRNA直接测序 全基因组tiling array芯片技术 2. 非编码RNA的识别 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 3
Winsg Che'4 Group of Bioinformatics @College of Life Science,Zhejiang University 000八 3.非编码RNA的功能预测 通过互作、共 获得ncRNA相关的一组基 表达、共定位 因和其它互作因子 功能富集 (miRNA等) 收集功能注释数 建立编码非编码 赋予模块内 据和相关性数据 网络,划分功能 模块 ncRNA功能 基于ncRNA序列,预测与其他 RNA或蛋白的结合 根据已知因子,推测ncRNA功能 相关预测平台:noncode,ChIPBase,starBase,LncRNADisease, DIANA-LncBase等 4
3.非编码RNA的功能预测 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 4 通过互作、共 表达、共定位 获得ncRNA相关的一组基 因和其它互作因子 (miRNA等) 功能富集 收集功能注释数 据和相关性数据 建立编码-非编码 网络,划分功能 模块 赋予模块内 ncRNA 功能 基于ncRNA序列,预测与其他 RNA或蛋白的结合 根据已知因子,推测ncRNA功能 相关预测平台:noncode, ChIPBase, starBase, LncRNADisease, DIANA-LncBase等
WigChe'4 Group of Bioinformatics @College of Life Science,Zhejiang University 00 、4.非编码RNA的编码潜能 IncRNA circRNA 2015年,发现骨骼肌特异表达IncRNA 编码46氨基酸的微肽(MLN) Circ-ZNF609编码蛋白,参与肌肉发生 2016年,发现另LncRNA,编码微肽 果蝇大脑中也发现大量circRNA:编码 DWORF,可增强ATP酶SERCA?活性。 蛋白质或多肽 1.常规ORF预测方法和标准实验方法容易忽略小于100氨基酸的微肽 2.核糖体测序(Ribo-seq)技术发现越来越多的ncRNA具有编码潜力 3.mRNA与ncRNA.界限变得模糊,可能需要重新定义。 5
lncRNA 2015年,发现骨骼肌特异表达lncRNA 编码46氨基酸的微肽(MLN) 2016年,发现另LncRNA ,编码微肽 DWORF,可增强ATP酶SERCA活性。 circRNA Circ-ZNF609编码蛋白,参与肌肉发生 果蝇大脑中也发现大量circRNA编码 蛋白质或多肽 4.非编码RNA的编码潜能 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 5 1. 常规ORF预测方法和标准实验方法容易忽略小于100氨基酸的微肽 2. 核糖体测序(Ribo-seq)技术发现越来越多的ncRNA具有编码潜力 3. mRNA与ncRNA界限变得模糊,可能需要重新定义
WigChe'4 Group of Bioinformatics @College of Life Science,Zhejiang University 00M八 5.非编码RNA的注释 一▣X tp://wwwnoncode.org P-C£NONCODE 个★可 文件份组日查看M收夹(内工具(①帮助刊 ONCODE An integrated knowledge database dedicated to ncitNAs.especiatly incRNAs Home Browse DB Search 下unction Disease Coaservation Blast Genome NETWATCH ID conversion ILneRNA Dowalead Statistles Authors FAQ Science NCM NONCODE (current version v5.0)is an integrated knowledge database dedicated to non-coding News RNAs(excluding tRNAs and rRNAs).Now,there are 17 species in NONCODE(human,mouse,cow, rat,chicken fruitfly,zebrafish,celegans,yeast). 65Gp2017 NONCCOE ha updated to NONCOGEV5 NONCODE2016 webute has been moved to http://www.biainta.crq/NONCODE2116 Search a gene/transcript,eg.NONHSAG0001482 Search 6Apr2017 NONCOOE has been maintained foe lump to section for this gene/transcript several days 23Dec2016 Nw Species plg was added to NONCODE Allases Crthologs Function Dsease 31u02015 线125%, 里s0·1”a 1.NONCODE数据库:http:lwww.noncode.orgl 2. 17个物种ncRNA信息(人、小鼠、牛、大鼠、鸡、果蝇、斑马鱼、线 虫、酵母、拟南芥、黑猩猩等) 3. ncRNA定位、序列、表达谱、外泌体表达谱、保守信息、功能预测、 疾病关联、RNA结构,以及Blast分析和LncRNA鉴定 6
5. 非编码RNA的注释 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 6 1. NONCODE数据库:http://www.noncode.org/ 2. 17个物种ncRNA信息(人、小鼠、牛、大鼠、鸡、果蝇、斑马鱼、线 虫、酵母、拟南芥、黑猩猩等) 3. ncRNA 定位、序列、表达谱、外泌体表达谱、保守信息、功能预测、 疾病关联、RNA结构,以及Blast分析和LncRNA鉴定
Winsg Che'4 Group of Bioinformatics @College of Life Science,Zhejiang University RNA基因 niRNA基因 000八 6.1 miRNA →RNA聚合D 一RNA聚合酶I1 转录 (1)内源性21-25nt小RNA niRNA初始转录物 niRNA初始转录物 S正所白 Drosha蛋白 m7G AAAAAA AAAAAA 一DCLI蛋白 m7G o- (2)前体具有发夹结构 DGCR界蛋自 奶级加工 初极加如工 果继中Ph蛋自 1NA前体 DCLI蛋白 (3)通过与Ago蛋白结合, miRNA前体 一HYLI蛋白 特异性调控基因的表达。 Exportin 5-RanGTP 二次加了 蛋白 (4)动物(a)和植物(b) 细胞核 HENI蛋白 miRNA的生物合成路径 细麻断 甲基化 AG014蛋白 (5)植物中,miRNA与靶 Dicer蛋白 IASY蛋白 果第中AGO1蛋自 果绳中Dicer 1蛋门 基因互补性高,指导AGO蛋 TRBP or PACT蛋白 果解中10QS蛋百 坛输 白切割靶基因mRNA;动物 二次加工 细响核 中互补性低,主要引起靶基 miRNA:miRNA°三案体 细胞质 AGO4雀白 因mRNA翻译抑制。 Dicer蛋直 果编中AG01蛋自 miRNA:miRNA◆二聚体 果中Dir1领白 解旋? TRBP or PACT蛋白 解旋南? 果蝇中400S蛋百 AGO蛋白 (6)一个miRNA可以调控多 个靶基因,一个基因也可以 -AGO1-4蛋白 AGO蛋白 被多个miRNA调控。 miRNA- 果蝇中10QS蛋自 miRNA- 复合物中成熟的■NA 复合物中成熟的iRNA
6. 1 miRNA Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 7 ( 1)内源性21 -25 nt 小RNA ( 2)前体具有发夹结构 ( 3)通过与Ago蛋白结合, 特异性调控基因的表达。 (4)动物(a)和植物( b ) miRNA的生物合成路径 (5)植物中, miRNA与靶 基因互补性高,指导AGO 蛋 白切割靶基因mRNA;动物 中互补性低,主要引起靶基 因mRNA翻译抑制。 (6)一个miRNA可以调控多 个靶基因,一个基因也可以 被多个miRNA调控
WigChe'4 Group of Bioinformatics @College of Life Science,Zhejiang University 000八 6.2 miRNA的生物信息学分析方法 mOmm miRBase miRBase MANCHETER Home Search Browse Help Download Blog Submit Latest miRBase blog posts miRNA count:28645 entries Dym0h3,2314 Release 21:June 2014 a last-gasp bug.Thoe data are now,tagged with the label "high"on the entry pages,and for a甘he FTP che.Thet国number of tin lb2 ed "hich confidence"hss increanod】 Search by miRNA name or keyword niRBase 21 fnally arrivits oysem [June2饭Z01d Go Exampie oogies for the longet-than-Nl.hRB力各fo指ilnble on the web,,all tata avelable for download on he FTP site.As usal,the release notes descrbe the mere chenges.of partinur note this tme.the Gencme Raference Download published miRNA data Download page I EIP ste miRBase:the microRNA database Twests by鱼nl由ae miRBase provides the following services: The miRBase database is a searchable database of published miRNA sequences and annotation,Each entry in the miRBase Sequence database represents a predicted hairpin portion of a miRNA transcript(termed mir in the database),with information on the location and sequence of the mature miRNA secuence (termed miR).Both hairpin and mature sequences are avallable for searching and browsing,and entries can also be retrieved by name,keyword,references and annotation.All sequence and annotation data are also available for download. The miRBase Registry provides miRNA gene hunters with unique names for novel miRNA genes prior to publication of resuits.Visit the help (1)获取miRNA的序列信息: miRNA权威数据库:miRBase(http:www.mirbase.org) 21.0版,涵盖223物种,包含28645条miRNA发夹前体,35828 条成熟miRNA。 6
6.2 miRNA的生物信息学分析方法 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 8 (1)获取miRNA的序列信息: miRNA 权威数据库:miRBase (http://www.mirbase.org/) 21.0版,涵盖223物种,包含28645条miRNA发夹前体,35828 条成熟miRNA
Wing Che'4 Group of Bioinformatics @College of Life Science,Zhejiang University 00八 (②)miRNA新基因的预测和鉴定 前体具有典型的发夹结构 能找到miRNA/miRNA*二聚中间体 在AGO蛋白中富集 Dicer或DCL1酶加工依赖性 9
(2) miRNA 新基因的预测和鉴定 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 9 前体具有典型的发夹结构 能找到miRNA/miRNA*二聚中间体 在AGO蛋白中富集 Dicer 或DCL1酶加工依赖性
Wig Chent'4 Group of Bioinformatics @College of Life Science,Zhejiang University 个心(3)miRNA靶基因的预测和鉴定 种子序列的互补性 序列保守性 热动力学因素 位点的可结合性 UTR碱基分布 miRNA.与靶基因组织分布的相关性 10
(3) miRNA 靶基因的预测和鉴定 Ming Chen’s Group of Bioinformatics @College of Life Science, Zhejiang University 10 种子序列的互补性 序列保守性 热动力学因素 位点的可结合性 UTR碱基分布 miRNA与靶基因组织分布的相关性