详解 ATAC-Seq

本文总阅读量

ATAC-seq,全称 Assay for Transposase-Accessible Chromatin with high throughput sequencing,是 2013 年由斯坦福大学 William J. Greenleaf 和 Howard Y. Chang 实验室开发的用来研究染色质可及性(通常也理解为染色质的开放性)的方法。

真核生物的核 DNA 并不是裸露的,而是组蛋白与之结合。DNA 一圈一圈地缠绕在 8 个组蛋白上,形成核小体,每个核小体占了约 147bp 的 DNA。一个个核小体构成了串珠样的结构,然后进一步折叠、聚合,并在其他架构蛋白的协助下,形成染色体。这样就能将超长的 DNA 链,折叠成很小很小的结构,塞进小小的细胞核里。

但是在基因转录的过程中,并非需要完全解开 DNA 链的全部结构,而是只需部分解开,即表达基因的区域。这一步骤主要依赖于染色体组蛋白的修饰,尤其是乙酰化。被打开的染色质称为开放染色质(open chromatin)。一旦染色质打开,调控蛋白(例如转录因子)就有机会结合其中。染色质的可及性是指染色质打开的特性,主要由染色体组蛋白的修饰实现,因此染色质的可及性反映了调控因子与开放染色质结合的程度,与转录调控密切相关。通过研究特定细胞状态下开放的染色质区域,我们能够在 DNA 水平上了解其转录调控机制。

研究开放染色质区域的技术

传统的实验方法主要包括 MNase-seq 和 DNase-seq,它们的主要思路是:当染色质变得开放时,DNA 和组蛋白的聚集程度降低,导致一部分 DNA 暴露出来。失去蛋白质的保护后,这部分 DNA 可被 DNA 酶(如 MNase 或 DNase I)切割。随后,我们对切割后的 DNA 进行测序,并将其与已知的全基因组序列进行比较,以确定哪些序列被切割,哪些基因序列未受影响,从而确定开放的染色质区域。但是这两种方法存在明显的缺陷,主要表现在耗时费力和重复性差的问题。

还有 FAIRE-Seq,先进行超声裂解,然后用酚-氯仿富集,不依赖酶和抗体,但弊端就是检测背景高,测序信噪比低,甲醛交联时间不好把握等等。

ChIP-Seq 是揭示特定转录因子或蛋白复合物的结合区域,实际是研究 DNA 和蛋白质的相互作用,利用抗体将蛋白质和 DNA 一起富集,并对富集的 DNA 测序。

整体的分析思路一致,这些技术找富集区域,对富集区域进行功能分析。

相比起来,ATAC-seq 是用 Tn5 转座酶,操作起来也更加简单,重复性好,而且最重要的一点是实验只需要很少的细胞/组织量,出来的信号也更加漂亮,所以 ATAC-seq 目前已经是研究染色质开放性首选的技术方法。

ATAC-seq 技术

ATAC-seq 技术用到了一个转座酶 Tn5:DNA 转座是一种由 DNA 转座酶介导,把 DNA 序列从染色体的一个区域插入到另外一个区域的现象,类似于“剪切粘贴”。这个过程,也是需要插入位点的染色质是开放的,否则就会被一大坨高级结构给卡住。

转座酶可以随机结合并切割染色质开放区的 DNA,并且可同时在切割位点插入接头序列。只要将携带已知 DNA 序列标签的转座复合物(即带红色和蓝色序列标签的 Tn5 转座酶)加入到细胞核中一起孵育,再利用已知序列标签进行 PCR 扩增即可形成文库,经过测序就可以获得染色质开放区的信息。

ATAC-seq 实验流程

一般来说包括以下几个步骤:

  • 细胞核制备
  • 片段化及 DNA 提取
  • PCR 扩增
  • 文库纯化
  • 高通量测序
  • 数据分析

ATAC-seq 技术的优势

  • 所需细胞量较低,而且信噪比高、特异性强、耗时短
  • 满足动物、植物、人等样本的要求,具有很好的物种适应性
  • 单细胞测序技术是近几年研究的热点,通过对单个细胞的测序能够将表观遗传学研究个体化。常见的 ChIP-seq、DNase-seq、MNase-seq 等技术无法进行单细胞测序,而 ATAC-seq 经过实验验证,表明其能够进行单细胞测序

ATAC-seq 技术的应用

那么说了这么半天的 ATAC-seq 归根到底是用来干嘛呢?主要有以下应用

  • 染色质开放性图谱绘制,表观基因组图谱
  • 找调控生物学过程的关键转录因子
  • 找哪个转录因子调控了研究的基因
  • 找转录因子调控的靶基因
  • 得到不同组织或不同条件下对应可及性区域。
  • 得到核小体位置
  • 生成转录因子结合区域的特征 (footprinting)

ATAC-seq 适用于机制研究,探索信号通路、表型变化、疾病等与基因调控的相关性。并以其简便高效、重复性好等优点,成为研究染色质开放区的有效技术方法。

在表观遗传研究中,ATAC-seq 能够探索表观修饰是否与研究目标有相关性,可通过 Open Chromatin 区域和 Motif 分析寻找参与基因调控的转录因子。ATAC-seq、CUT&Tag 和 RNA-seq 等方法技术能够助力科研人员进行相关研究

ATAC-seq 的技术限制

  • Tn5 通过插入剪断 DNA 并将测序接头连接到剪断的两个 DNA 片段的末端,因此对于一个 DNA 片段而言,其两端的接头连接是随机的,导致同一片段两端的接头有 50%的概率是同一接头。而只有连接不同接头的片段才可用于富集扩增及测序,因此一半的片段无法利用
  • 大量剪断的 DNA 由于片段过大,无法进行 PCR 富集
  • Tn5 的活性受反应溶液的组成及反应条件影响,仍然需要优化以便提高剪切效果
  • ATAC-seq 在植物细胞存中存在细胞壁、叶绿体线粒体等细胞器污染,缺少稳定遗传的细胞系等问题

参考资料