Bioinformatics

一次修改注释文件的经历

今天有一位师姐在看到我之前的 基因家族鉴定 帖子之后,请我帮忙修改一份注释文件,他们找了公司测得的文件,格式与标准的注释文件有所差别,于是我使用 Excel 和 Notepad++对文件的格式进行了修改。

使用 HMMER 网页工具进行结构域分析

由于数据库之间的差异,使用 NCBI CDD Search 搜索结构域有时候并不能满足我们的需要,比如我们通常使用 HMMER 来鉴定同一家族的基因并且需要进行结构域可视化,但 HMMER 所使用的数据都来自 pfam,它的数据库可能与 NCBI 的不同,因此而造成结果上的差异,有的时候这种情况会影响我们后面的研究,于是,使用 hmmer 网页工具 来进行结构域分析可能会更好。

转录组学分析基础——测序技术

转录组的研究对象为特定细胞在某一功能状态下所能转录出来的所有 RNA 的总和,其原始数据便是测序文件,因而了解测序技术对进行转录组学分析具有重要的意义。

植物基因组蛋白质序列的制备

一般情况下,植物基因组 DNA 序列及注释文件可以在 ensembl 网站直接下载到,但蛋白质序列貌似不是很好下载,各处下载的序列文件格式、ID 等都有很大的不同,NCBI 上的也比较杂乱,所以还是自己翻译为好,这里依旧使用 TBtools。

WSL 搭建生信分析环境

在做生信分析的时候,很多情况下都会用到 Linux 环境,而大多数人的电脑都是 Windows 环境,目前 Windows 下使用 Linux 最主流的两种方法就是服务器和虚拟机,但服务器的价格比较高,并且在文件传输等方面不太方便;虚拟机对电脑的要求比较高,并且占用也很大、启动时间长且配置较为麻烦,现如今,在 Windows 上已经有 WSL 了,使用它做生信分析极大地提高了效率,避免了很多问题。

TBtools 快速完成基因功能注释

基因功能注释质量好坏取决于数据库质量高低,是否全面。于是,本地化进行基因功能注释,需要收集尽可能多的数据库(这个其实很不实际),也需要有较好的计算资源。通过使用网页服务工具,可以克服这个问题。我们可以一直使用最新最全的数据库,同时不需要消耗本地计算资源。

Linux 下安装 BUSCO

官网说 BUSCO 直接可以用 conda 安装,但。.. 我从来没有成功过,经过多次的实践,总结了能够成功安装 BUSCO 的方法。..

TBtools 制作基因表达热图详解

使用 TBtools 制作基因表达热图实在是方便,美化起来也很简单,本文以水稻的一组基因为例,讲述基因表达数据的获取、处理并使用 TBtools 出图。