以下为《生物信息学知识点总结》的无排版文字预览,完整内容请下载
1生物信息学:专指应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据,也称分子生物信息学
2低二级结构:二级结构成分含量很低的蛋白质结构
3二次数据库:以基因组序列和结构数据库为基础,结合文献研究而开发的具有特色,便于使用的数据库
4数据库查询:指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配
5数据库搜索:是指通过特定相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列
6缩写:STS:测序标签位点GSS:基因组综述序列EST:表达序列标签
7检测序列:新测定的,希望通过数据库搜索确定其性质或功能的序列
8目标序列:通过数据库搜索得到的和检测序列具有一定相似性的序列
9同源序列:是指某一共同祖先经趋异进化而形成的不同序列
10相似性:序列比对过程中用来描述检测序列和目标序列之间相同DNA或蛋白质残基序列所占比例的高低
1生物学数据的特点:海量、复杂(A生物体的结构与功能以及生命活动过程本身的多样性 B生物学研究的社会学原因,生物学的实验数据无标准词法、句法)
2研究现状:人类基因组、模式生物基因组。模式生物包括:鼠、拟南芥、玉米、酵母、大肠杆菌
3生物信息学的发展阶段:前基因组时代、基因组时代、后基因组时代
4生物信息学的前沿技术:数据管理技术、数据仓库,数据挖掘与数据库的知识发现技术、图像处理与可视化技术
5人类基因组计划:英、美、法、德、日、中
6分子生物信息数据库种类:基因组数据库、核酸和蛋白质的一级结构序列数据库、生物大分子的三维空间结构数据库、以上三类数据库和文献资料为基础构建的二次数据库
7序列数据库组成 序列数据(来自核苷酸和蛋白质序列测定)、注释信息(一部分有计算机程序分析生成,一部分依靠生物学家通过查阅文献资料而获得)
8基因组数据库 GDB和AceDB
9国际三大主要核酸序列数据库EMBL、GenBank、DDBJ
10常用的蛋白质序列数据库PIR、SWISS-PROT和TrEMBL
11PIR的构成:PIR1 :序列已验证,注释最为详尽;PIR2:包含尚未确定的冗余的序列;?PIR3:尚未加以验证,也未加注释;PIR4:包括各种渠道获得的序列,既未验证,也无注释。
12SWISS-PORT数据库最为常用,它包括:结构域,功能为点,跨膜区域,二硫键位置,翻译后修饰,突变体等
13蛋白质数据库PDB(Protein Data Bank)的测定技术:晶体衍射方法和多维核磁共振溶液构象测定方法,文件存放方式:文本文件方式
14蛋白质结构分类包括的层次:折叠类型、拓扑结构、家族超家族、结构域、二级结构、超二级结构
15主要的蛋白质分类数据库:SCOP和CATH
16SCOP(Structure dassification of Protein)分为以下七类:α型、β型、α/β型(螺旋和折叠交替出现)、α+β型(螺旋和折叠连续出现)、外结构域蛋白质、膜蛋白质和细胞表面蛋白质、小蛋白
17CATH分为以下四类:α为主类、β为主类、α/β类、低二级结构
18二次数据库有两个:E.coli基因组数据库和真核生物基因调控转录因子数据库
19Prosite数据库实际包括两个数据库文件:数据库文件Prosite和说明文件PrositeDoc
20PA行给出功能位点的序列模式实例:[GSK]-F-X(2)-[LIVNF]-X(4)-[RKFQA]-X(2)-[RST]-X-[GA]-X-[KN]-P-X-T可能模式:GFXXLXXXXRXXRXGXKPXT
21SRS主页start进入系统三种查询:快 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 置;
相关文献作者 题目 刊物 日期;序列特征表; 碱基组成;序列(每行60个碱基)
24 PIR的构成:PIR1 :序列已验证,注释最为详尽;PIR2:包含尚未确定的冗余的序列;??????? PIR3:尚未加以验证,也未加注释;PIR4:包括各种渠道获得的序列,既未验证,也无注释。
25 PDB数据库主要内容和格式: 结构名称、编号、简单说明、递交日期;化合物名称、来源、测定方法;结构递交者的姓名、单位、来源地址;相关文献作者、题目、刊物、日期;结构的测定和修正注释:一级结构,二级结构,二硫键,复合物信息,构晶胞参数,旋转矩阵,原子坐标,二硫键配对标志,文件结束标志。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《生物信息学知识点总结》的无排版文字预览,完整内容请下载
生物信息学知识点总结由用户“杨蕊18”分享发布,转载请注明出处