染色质免疫沉淀-测序(Chip-sequencing,简称 Chip-seq)用于分析蛋白质与 DNA 的交互作用。此技术结合了染色质免疫沉淀(Chip)和高通量 DNA 测序,旨在鉴定与 DNA 结合的蛋白质位点,从而精确绘制全基因组上目标蛋白的结合区域。在 Chip-seq 出现之前,Chip-on-chip 技术是研究蛋白质-DNA 相互作用的常用方法。
Chip(染色质免疫沉淀)技术被用于鉴定蛋白质与 DNA 的相互作用。因此,当前的 Chip-Seq 研究主要涉及两大类应用:转录因子的调控和组蛋白的修饰。
在分子生物学中,转录因子(Transcription factor,TF)是能够结合在某基因上游 5’端特异序列上的蛋白质,它作为反式作用因子(能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与靶基因转录效率调控的蛋白质或 RNA),与真核基因的顺式作用元件比如启动子、增强子等发生特异性相互作用,从而激活或者抑制基因的转录。
转录因子分为两类:通用转录因子和特异性转录因子。通用转录因子几乎在所有生物体细胞中都有存在。特异性转录因子在启动引发重大发育变化的基因表达模式中通常起着非常关键的作用。这些转录因子最显著的特点是都拥有 DNA 结合域,这使得它们能够与特定的 DNA 序列(称为增强子或启动子)上的 motif 结合。一些转录因子会与 DNA 上的启动子序列结合,靠近转录起始位点,从而帮助组装转录起始复合物。而其他转录因子则与调节序列,比如增强子序列,结合,它们能够刺激或抑制相关基因的转录活动。
解析转录因子如何与 DNA 互作以调节基因表达的过程对于深入理解多种生物过程和疾病状态至关重要。在此过程中,Chip-seq 技术能够发挥关键作用。
染色质是指间期细胞核内由 DNA、组蛋白、非组蛋白及少量 RNA 组成的线性复合结构,是间期细胞遗传物质存在的形式。
通过组蛋白特异性抗体,将带有特定修饰的组蛋白-DNA 复合物沉淀下来,从而获取组蛋白结合的 DNA,然后通过测序,可获得组蛋白在染色体上的分布情况,从而确定组蛋白修饰相关的特定位点,还可以确定组蛋白修饰酶类的靶标。Histone Chip-seq 一般与 ATAC-seq、RNA-seq 等一起联用。
组蛋白 N 端具有赖氨酸和精氨酸富集的尾巴,这些尾巴上的氨基酸可以被修饰酶添加不同的化学修饰,例如磷酸化、甲基化、乙酰化和泛素化等。这一过程被称为组蛋白修饰。在表观遗传学领域,组蛋白修饰对基因表达的调控起到关键作用,这种修饰属于蛋白质翻译后修饰(PTM),通过共价方式进行,包括甲基化(M)、磷酸化(P)、乙酰化(A)等。
组蛋白包括 H2A、H2B、H3 和 H4 四种类型,其中“H”代表组蛋白,“K”代表赖氨酸位点,“me”表示甲基化修饰的个数,“ac”代表乙酰化修饰。
鉴于组蛋白修饰种类众多,我们在称呼组蛋白修饰时应遵循一定的命名规则:
组蛋白结构 + 氨基酸名称 + 氨基酸位置 + 修饰类型。
在实际应用中,通常这样表示:
组蛋白修饰应用于 Chip-seq 分析领域,有助于解析表观遗传特征和生物学功能。表观基因组学联盟提出的五个“核心组蛋白标记”在 Chip-seq 分析中得到了广泛应用:
详尽分析组蛋白修饰有助于更深入地理解发育和分化过程中的表观遗传机制。
Chip-Seq 实验旨在验证一个特定的转录因子与 DNA 是否相互作用。在实验前,研究者已经确定了感兴趣的转录因子。通过设计针对该转录因子的抗体,进行 Chip 实验以捕获与之结合的 DNA 片段。这种方法有助于鉴定特定蛋白质与 DNA 之间的相互作用。
相比之下,ATAC-Seq 技术不针对特定的转录因子,而是用于检测全基因组范围内染色质的开放程度。通过这种技术,可以在全基因组水平上识别可能与蛋白质结合的位点。将 ATAC-Seq 与其他方法结合使用,可以帮助研究者筛选出感兴趣的调控因子。
Chip(染色质免疫沉淀)实验的基本步骤大致如下:
通过测序获得的 DNA 片段被映射到参考基因组上。实际上,这些 DNA 片段是随机的。当靶蛋白结合的片段数量增加时,测序得到的数据量也会增加。因此,在特定位置检测到的 DNA 片段堆叠高度会随之增加。相反,如果在该位置没有蛋白结合,DNA 片段堆叠就会非常低。这些 DNA 片段的堆叠被称作峰(Peak)。在下图中,红色和蓝色的箭头分别表示基因组中正链和负链的映射方向。将两个峰合并后,就能得到最终的峰。这样,我们就得到了文章中常见的 Chip-seq 峰图,其中 y 轴表示映射到的片段拷贝数,代表 Chip-seq 的信号强度,而 x 轴表示基因组坐标。