JiaoYuan's Blog

转录组学分析基础--测序技术

转录组的研究对象为特定细胞在某一功能状态下所能转录出来的所有 RNA 的总和,其原始数据便是测序文件,因而了解测序技术对进行转录组学分析具有重要的意义。

第一代测序技术

1975 年由 Frederick Sanger 所提出的链终止法以及 1977 年由 Walter Gibert 所发明的链降解法被称为第一代测序技术。

1977 年,Walter Gilbert 和 Frederick Sanger 发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体 X174,全长 5375 个碱基。Walter Gilbert 和 Frederick Sanger 也因在测序技术中的贡献获得了 1980 年诺贝尔化学奖。

第一代测序技术大体上是仿照 DNA 合成的原理来进行的,正常的 DNA 合成主要分为以下几个步骤

Sanger 测序技术大致分为以下几个步骤

实际上 Sanger 测序的核心在于形成不同长度的 DNA 片段。在四个容器中分别加入 DNA 合成所需要的模板链、四种 dNTP、引物和一种 ddNTP,由于 ddNTP 和 dNTP 一样,可以与 dNTP 结合,但 ddNTP 在与 dNTP 结合后便不能再与 dNTP 结合,并且与 ddNTP 结合的位点是随机的,那么在一个容器中放入大量的反应物(ddNTP 只放入一种)便可以得到许多不同长度的序列片段,四个容器分别放入四种不同的 ddNTP 并且分别加入一定比例带有放射性同位素标记的 ddNTP。

随后通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的 DNA 序列。

补充

优点

缺点

第二代测序技术

高通量测序技术 (High-throughput sequencing, HTS) 是对传统 Sanger 测序技术革命性的变革,可以一次对几十万到几百万条核酸分子进行序列测定,因此也称其为下一代测序技术 (Next Generation Sequencing, NGS),高通量测序技术的出现使得对一个物种的转录组和基因组进行细致全貌的分析成为可能。

了解第二代测序技术需要先了解几个必要的概念

二代测序主要分为以下几个步骤

二代测序的原理也因测序平台的不同而略微有所不同,主要有以下平台

二代测序的主要过程:

在对所选样品提取核酸(DNA 或 RNA)后,通过标准方法 QC 检查。如果样品为 RNA,转录为 cDNA。采用酶处理或超声处理,将 cDNA 或 DNA 片段化。优化过程需参考部分片段样本的电泳情况。这些片段会被修复并连到更短的通用 DNA 片段或适配体上。适配体序列适用于测序平台,可在多重测序中识别。在一次运行中,可以同时测序大量带有适配序列的 DNA 片段,也称为测序库。

接下来,通过凝胶电泳或磁珠选择合适大小的片段,以优化测序性能。然后使用 PCR 扩增文库。在涉及乳化 PCR 的技术中,每个片段都与一颗乳化珠结合,为测序簇打下基础。扩增后进行清理步骤,去掉不必要的片段,提高测序效率。

最后,用 qPCR 检查文库以确认 DNA 质量和数量,确保测序样品合适。在加载到测序仪前,或在测序仪上进行文库片段的克隆扩增,具体取决于所选的平台和化学方法。最后根据所选择的平台对序列进行检测和报告。

优点

缺点

第三代测序技术

第三代测序技术是指单分子测序技术。DNA 测序时,不需要经过 PCR 扩增,实现了对每一条 DNA 分子的单独测序。第三代测序技术也叫从头测序技术,即单分子实时 DNA 测序。

第三代测序技术原理主要分为两大技术阵营:

单分子荧光测序

代表性的技术为美国螺旋生物 (Helicos) 的 SMS 技术和美国太平洋生物 (Pacific Bioscience) 的 SMRT 技术。脱氧核苷酸用荧光标记,显微镜可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入 DNA 链的时候,它的荧光就同时能在 DNA 链上探测到。当它与 DNA 链形成化学键的时候,它的荧光基团就被 DNA 聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响 DNA 聚合酶的活性,并且在荧光被切除之后,合成的 DNA 链和天然的 DNA 链完全一样。

纳米孔测序

代表性的公司为英国牛津纳米孔公司。新型纳米孔测序法(nanopore sequencing)是采用电泳技术,借助电泳驱动单个分子逐一通过纳米孔 来实现测序的。由于纳米孔的直径非常细小,仅允许单个核酸聚合物通过,而 ATCG 单个碱基的带电性质不一样,通过电信号的差异就能检测出通过的碱基类别,从而实现测序。

优点

缺点

测序技术与 RNA-seq

RNA-Seq 是一种高通量测序技术,它利用测序技术对组织或细胞中的 RNA 反转录成 cDNA 文库进行测序。这种技术可以测量不同 RNA 的表达量,发现新的转录本,并通过将转录本映射回基因组来确定转录本的位置,了解剪切情况等遗传信息。RNA-Seq 在生物学研究、医学研究、临床研究和药物研发等领域得到了广泛应用。

RNA-seq 不仅可以用于识别新的转录本、检测剪接位点的变异和新的剪接事件、分析基因的表达差异等,同时也可以与其他生物信息学分析技术(如功能预测、文献挖掘等)结合使用,以发现新的生物学规律和潜在的疾病标志物。

在选择测序技术时,二代测序(如 Illumina 公司的测序平台)因其高通量和低价,常被选为研究转录本的测序技术。而三代测序(如 PacBio 和 Oxford Nanopore 等平台)因其更长的读取长度,可以直接获取完整的转录本信息,尤其适合发现新的转录本,对于研究长的非编码 RNA 和复杂剪接事件具有巨大优势,可以通过对 RNA 样本进行深度测序,可以全面了解基因在转录水平上的表达情况。

参考资料