JiaoYuan's Blog

挖掘 TFBS 的利器--DAP-Seq

转录因子是能够特异性地与 DNA 上的顺式作用元件相互作用的蛋白质,它们对基因的转录起到激活或抑制的作用。在植物的生长发育和对逆境的应对中,转录因子扮演着关键的调控角色。转录因子结合位点是转录因子在调节基因表达时与其互作的 DNA 片段,通常位于基因的模板链上,并具有 5 到 20 个碱基对的长度。一个转录因子能够同时调控多个基因,尽管这些基因的 TFBS 在序列上保持一定的保守性,但也存在差异。

在基因组学和表观遗传学的研究中,识别和分析 TFBS 一直是研究的热点。虽然传统的染色质免疫共沉淀测序(ChIP-seq)方法在高质量抗体的条件下能有效鉴定 TFBS,但制备高质量抗体常常具有挑战性,这限制了 ChIP-seq 技术的广泛应用。

2016 年 5 月,美国 Salk 研究所的研究者在《Cell》期刊上发表了题为 《Cistrome and Epicistrome Features Shape the Regulatory DNA Landscape》 的研究论文。该研究介绍了一种名为 DAP-Seq(DNA 亲和纯化测序)的技术,该技术能迅速描绘出蛋白质结合的靶向 DNA 区域的图谱,即顺反组(cistrome)中的蛋白质结合区域。为了深入探究生长发育、行为和疾病的复杂转录调控网络,构建完整的顺反组和表观组图谱(epicistrome maps)至关重要。

DAP-Seq 技术结合了蛋白质的体外表达和高通量测序,无需为每个转录因子制备特异性抗体。因此,它具备快速、高通量和成本效益的特点,并且比 ChIP-seq 技术更容易扩展。该方法适用于大部分植物,为科学家提供了一种研究调控序列中的遗传或表观遗传变异如何影响植物性状和机制的途径。

DAP-seq 实验原理

体外表达的蛋白和 DNA 进行亲和纯化,将与蛋白结合的 DNA 洗脱后进行高通量测序。其基本过程是将编码转录因子的 CDS 序列构建到含有亲和标签(Halo-Tag)的载体中,构建蛋白表达载体,进行体外蛋白表达,形成转录因子和亲和标签的融合蛋白;提取样品的基因组 DNA,构建 DNA 文库,然后将体外表达的带有亲和标签的转录因子和 DNA 文库进行结合,随后把结合的 DNA 洗脱后上机测序。

DAP-seq 实验流程

主要步骤包括 DNA 文库构建、蛋白表达、蛋白与文库的结合反应、文库 PCR 加接头及定量检测、上机测序、生信分析等。

麦胚无细胞蛋白表达系统

DAP-seq 技术中,常用的体外蛋白表达方法是小麦胚芽无细胞蛋白表达系统(Wheat germ cell-free protein synthesis system, WGCF)。该系统基于外源 DNA 或 mRNA 模板,在细胞提取物提供的细胞器和多种酶的协同作用下,通过添加氨基酸、T7 聚合酶及能量再生物质,实现蛋白质的体外合成。这些细胞提取物可来源于多种细胞类型,如大肠杆菌、小麦胚芽、兔网织红细胞、酵母和昆虫细胞等。与传统的细胞内蛋白表达系统相比,无细胞蛋白表达系统显示出多项优势:蛋白质表达快速且准确,表达与修饰过程易于调控,且不受细胞生长代谢的干扰。此外,该系统还能合成具有细胞毒性、低丰度或含有非天然氨基酸的特殊蛋白质。

小麦胚芽(麦胚)是小麦籽粒中生命活动最为活跃的部分,它拥有蛋白质合成所需的全套要素,包括合成场所、蛋白质因子以及必要的酶系。因此,科学家们利用小麦胚芽建立了无细胞蛋白表达系统。相较于大肠杆菌无细胞系统,WGCF 更适合表达真核基因,能够高效地体外合成复杂的真核蛋白,并确保其正确折叠。

适用范围

DAP-seq 的优缺点

优点:

缺点:

参考资料