以下为《打印 基因家族分析套路 (1) 人人文库0602》的无排版文字预览,完整内容请下载
基因家族分析套路(一)
近年来,测序价格的下降,导致越来越多的基因组完成了测序,在数据库中形成了大量的可用资源。如何利用这些资源呢?今天小编带你认识一下不测序也能发文章的思路--全基因组基因家族成员鉴定与分析(现在这一领域可是很热奥);
一、基本分析内容
数据库检索与成员鉴定
进化树构建
保守domain和motif分析.
基因结构分析.
转录组或荧光定量表达分析.
二、数据库检索与成员鉴定
1、数据库检索
1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了
Brachypodiumdb:
TAIR:
Rice?Genome?Annotation?Project?:.
Phytozome:
Ensemble:?
NCBI基因组数据库:
2)已鉴定的家族成员获取。
? ? ??如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:
???a.?NCBI:?nucleotide?and?protein?db.
?????b.?EBI:?.
?????c.?UniProtKB:
2、比对工具。一般使用blast和hmmer,具体使用命令如下:
Local?BLAST
formatdb–i?db.fas–p?F/T;
blastall–p?blastp(orelse)?–i?known.fas–d?db.fas–m?8?–b?2(or?else)?e?1e-5?–o?alignresult.txt.
-b:output?two?different?members?in?subject?sequences?(db).
Hmmer?(hidden?Markov?Model)?search.?Thesame?as?PSI-BLAST?in?function.?It?has?a?higher?sensitivity,?but?the?speed?islower.
Command:
hmmbuild--informatafaknown.hmmalignknown.fa;?
?hmmsearchknown.hmmdb.fas>align.out.
3、过滤。
Identity:?至少50%.
Cover?region:?也要超过50%或者蛋白结构域的长度.
domain:?必须要有完整的该蛋白家族的。工具pfamdb?()?和NCBI?Batch?CD-?search.?().
EST?支持
?Blast?and?Hmmer同时检测到
4、通过上述操作获得某家族的所有成员
基因家族分析套路(二)
本次主要讲解在基因家族分析类文章中,进化部分分析的内容。主要是进化树的构建与分析。
一、构建进化树的基本步骤
1、多序列比对.?Muscle?program.
2、Model?选择.?分别针对蛋白序列和核酸序列的模型选择程序。ProtTest?program?for?protein?and?ModelTest?or?Jmodetlest?for?DNA().
3、算法选择。三种.?NJ,?ML?and?BI.
4、软件选择。?MEGA?(bootstrap?least?1000?replicates),?phyML?and?Mrbayes?().
5、进化树修饰.?MEGA:?view->options?and?subtree->?draw?options.?Also?can?be?decorated? 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 d_hits.bam
???samtools?view?-h?-o?output-uniq.sam?output_uniq.bam
excel?for?calculation(low?frequencyreads?≤5?were?omitted?).
3)差异表达的基因。
?寻找存在差异表达的家族成员,推测其可能的功能。有下面两种分析策略,均可采用。
a.倍数法。对于基因家族分析,可以采用倍数法,以2倍为标准,得到上调和小的基因
b.CV值。计算某个成员在不同处理下的基因表达变化。CV?=SD/mean.Used?in?differenttissues?or?organs?anlysis.
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《打印 基因家族分析套路 (1) 人人文库0602》的无排版文字预览,完整内容请下载
打印 基因家族分析套路 (1) 人人文库0602由用户“dqszbls”分享发布,转载请注明出处