NCBI中各符号代表的意思-FreeNAS中文网

admin 管理员组

文章数量: 887021

2023年12月24日发(作者：it短期培训学费多少)

GenBank 中字符的意思

Nucleotide 数据库分为三个子数据库：

·EST :表达序列标记数据库

·GSS ：基因组测序序列数据库

·CoreNucleotide ：包含所有未被以上两个子数据库收录的核苷酸序列

● MeSH：查询缩写基因的全称

3、RefSeq（Reference Sequence）序列接受号：

（1）mRNA 记录(NM_*):

e。g。:NM_000492

（2）基因组的DNA重叠群（NT_＊）:

e.g。：NT_000347

（3）完整的基因组或染色体（NC_*）:

e。g。：NC_000907

(4）基因组的局部区域（NG_＊）:

e。g。：NG_000019

（5）从人类基因组注释、加工得到的序列模型（XM，XP，or XR_＊）：

e。g。：XM_000483

● GenBank记录中特性表中的主要关键词:

解释关键词

promoter

CAAT_signal

TATA_signal

解释

转录起始区

真核启动子上游的CAAT盒，与RNA结合相关

真核启动子的TATA盒

关键词

misc_feature

生物学特性无法用特性表关键词描述的序列

misc_difference

序列特性无法用特性表关键词描述的序列

conflict

同一序列在不同的研究中在位点或区域上有差异

unsure

序列不能确定的区域

old_sequence

variation

modified_base

gene

misc_signal

该序列对以前的版本做过修订

包含稳定突变的序列

修饰过的核苷酸

已识别为基因或已命名的序列区域

无法用信号特性关键词描述的信号序列

—35_signal

—10_signal

GC_signal

RBS

polyA_signal

enhancer

原核启动子中的—35框

原核启动子的Pribow盒

真核启动子的GC盒

核糖体结合位点

RNA转录本的剪切识别位点

增强子

关键词

attenuator

terminator

rep_origin

misc_RNA

prim_transcript

precursor_RNA

mRNA

5’clip

3’ clip

5’UTR

3’UTR

exon

关键词

解释

与转录终止有关的序列

转录终止序列

双链DNA复制起始区

无法用RNA关键词描述的转录物或RNA产物

初始转录本

前体RNA

信使RNA

前体转录本中被剪切掉的5’端序列

前体转录本中被剪切掉的3'端序列

5’非翻译区

3'非翻译区

外显子

关键词

CDS

sig_peptide

transit_peptide

mat_peptide

intron

polyA_site

rRNA

tRNA

scRNA

snRNA

snoRNA

解释

蛋白质编码序列

编码信号肽的序列

转运蛋白编码序列

编码成熟肽的序列

内含子

RNA转录本的多聚腺苷酸化位点

核糖体RNA

转运RNA

小细胞质RNA

小核RNA

加工和修饰rRNA的小核RNA

解释关键词

repeat_unit

LTR

Satellite

解释

单个的重复元件

长末端重复序列

卫星重复序列

immunoglobulin_related

C_region

D_segment

免疫相关蛋白上的不变区

免疫球蛋白重链的可变区，

T细胞受体β链

免疫球蛋白重链、轻链以及T细胞α、β、γ的结合链

插入重排免疫球蛋白片段间的核苷酸

免疫球蛋白重链的开关区

编码免疫球蛋白的可变区N末端的序列

编码免疫球蛋白的可变区的序列

基因组中所包含的重复序列

无法用结构关键词描述的核酸序列高级结构或构型

J_ segment misc_binding

无法描述的核酸序列结合位点

primer_bind

protein_bind

STS

复制、转录的引物结合位点

蛋白质结合区

测序标签位点

N_ region

S_ region

V_ region

V_ segment

repeat_region

misc_structure

misc_recomb

无法用重组特性关键词描述的重组事件

iDNA

通过重组所消除的DNA

stem_loop

发夹结构

D_loop

线粒体中DNA中的取代环

◆ GenBank记录中特性表中的限定词：

限定词

/allele=

含义

给定基因的等位基因

限定词

/codon_start=

含义

相对于序列第一个碱基，编码序列密码子的偏移量

DNA样本的来源国

其他数据库信息的交叉索引号

DNA复制方向

/bound_moiety=

嵌合范围

/cell_type=

/citation=

/clone_lib=

获得序列的细胞类型

已被引用的参考文献数

获得序列的克隆文库

/country=

/db_xref=

/direction=

/environmental_sample=

序列直接从环境材料中获得而没有指明来源物种

限定词含义

限定词

/exception=

含义

指明DNA序列未按通常的生物学规律翻译，如RNA编辑

在种群中发生变异的频率

/PCR_conditi—ons=

描述PCR的反应条件

/frequency=

/germline

/pop_variant=

如果序列是DNA并来源于/product=

免疫球蛋白家族，则表示该序列来源于未重排DNA

/insertion_seq=

序列来源于某种插入元件

/anticodon=

/isolate=

/lab_host=

/macronuclear

/note=

/organelle=

/sub_strain=

/tissue_type=

/translation=

序列来源的生物个体

为扩增序列来源物种所用的实验室宿主

指明DNA来源于染色体分化的大核期

评论及附加信息

获得序列的细胞器

获得序列的来源微生物亚种

获得序列组织类型

按通用或指定的密码子表翻译的氨基酸序列

/cell_line=

/chromosome=

/clone=

/codon=

/EC_number=

/transl_table=

/usedin=

/virion

获得序列的群体变异种名称

序列编码产物的名称

tRNA反义密码子的位置及它所编码的氨基酸

获得序列的细胞系

获得序列的染色体

获得序列的克隆子

指出与参考密码子不同的密码子

序列产物的酶学编号

描述在翻译中与通用密码表不同的密码表

表明该特性在其他检索中也被使用

病毒颗粒

限定词

/cons_splice=

/cultivar=

/dev_stage=

/evidence=

/focus

含义限定词含义

相关特性在基因图谱上的位置

被修饰碱基的简写

从5'→3’注明遗传元件的顺序

提供测序用遗传物质的物种的科学名称

序列特性所导致的表型

区分内含子剪切位点和/map=

“5‘——3’”剪切位点

所获序列植物的栽培变种

/mod_base=

序列来源于某种生物的特定发育阶段

序列特性来源于实验还是推理

指出在记录中的来源特性在其他物种中还有不同的来源特性

序列所代表的功能

/number=

/organism=

/phenotype=

/function=

/haplotype=

/plasmid=

/protein_id=

/proviral

/rearranged

获得序列的质粒名称

蛋白质的检索号

整合在基因组中的前病毒

如果序列是DNA并来源于免疫球蛋白家族，则表示该序列来源于重排DNA

含义

转座子

获得序列的生物变种

假基因

序列来源于某种物种的单倍体

/isolation_sou-rce=

描述序列来源物种的生理、环境和地理信息

/label=

序列特性的俗名

限定词

/rpt_family=

/rpt_unit=

/serotype=

/sex=

/specimen_vou—cher=

/strain=

/sub_species=

/tissue_lib=

/transgenic

/transl_except=

含义

重复序列

指明重复区域的重复元件构成

同一物种的不同血清学特征

获得序列的物种性别

指明来源物种保存于什么地方

获得序列的菌珠

获得序列的来源物种的亚种

获得序列组织库

指明物种的来源特性是否是转基因受体

标明序列中未按指定密码子表翻译的氨基酸的位置

限定词

/transposon=

/variety=

/pseudo

/replace=

表明特性间的间隔序列已被替换

/rpt_type=

重复序列的组织方式

/sequenced_m—ol=

获得序列的分子类型

/serovar=

同一原核生物的血清学特征

/specific_host=

获得序列的天然宿主

/standard-name=

特性的通用名称

/sub_clone=

获得序列的亚克隆

◆ BLAST

1. blastn （nucleotide blast）是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。

2. blastp (protein blast)是蛋白序列到蛋白库中的一种查询.库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

3. blastx是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列（一条核酸序列会被翻译成可能的六条蛋白），再对每一条作一对一的蛋白序列比对.

4. tblastn是蛋白序列到核酸库中的一种查询。与blastx相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对.

5. tblastx是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列），这样每次比对会产生36种比对阵列。

Accession

AC_123456

Molecule Method

Genomic Mixed

AP_123456 Protein Mixed

NC_123456 Genomic Mixed

NG_123456 Genomic Mixed

NM_123456 mRNA Mixed

Note

Alternate complete genomic

molecule。 This prefix is used

for records that are provided to

reflect an alternate assembly

or annotation。 Primarily used

for viral, prokaryotic records。

Protein products; alternate

protein record。 This prefix is

used for records that are

provided to reflect an

alternate assembly or

annotation。 The AP_ prefix was

originally designated for

bacterial proteins but this

usage was changed。

Complete genomic molecules

including genomes，

chromosomes, organelles，

plasmids.

Incomplete genomic region;

supplied to support the NCBI

genome annotation pipeline。

Represents either

non—transcribed pseudogenes，

or larger regions representing

a gene cluster that is difficult

to annotate via automatic

methods.

Transcript products; mature

NM_123456789

NP_123456

NP_123456789

Protein Mixed

NR_123456 RNA Mixed

NT_123456 Genomic Automated

NW_123456

NW_123456789

Genomic Automated

NZ_ABCD12345678 Genomic Automated

XM_123456

XM_123456789

mRNA Automated

XP_123456

XP_123456789

Protein Automated

XR_123456 RNA Automated

YP_123456

YP_123456789

Protein Mixed

messenger RNA （mRNA）

transcripts.

Protein products； primarily

full-length precursor products

but may include some partial

proteins and mature peptide

products。

Non—coding transcripts

including structural RNAs,

transcribed pseudogenes, and

others.

Intermediate genomic

assemblies of BAC and/or Whole

Genome Shotgun sequence data。

Intermediate genomic

assemblies of BAC or Whole

Genome Shotgun sequence data.

A collection of whole genome

shotgun sequence data for a

project. Accessions are not

tracked between releases。 The

first four characters following

the underscore （e。g. 'ABCD’)

identifies a genome project。

Transcript products； model

mRNA provided by a genome

annotation process； sequence

corresponds to the genomic

contig.

Protein products; model

proteins provided by a genome

annotation process; sequence

corresponds to the genomic

contig.

Transcript products; model

non-coding transcripts

provided by a genome annotation

process； sequence corresponds

to the genomic contig.

Protein products; no

corresponding transcript

record provided。 Primarily

used for bacterial， viral， and

mitochondrial records.

ZP_12345678

NS_123456

Protein Automated Protein products; annotated on

NZ_ accessions （often via

computational methods）.

Genomic Automated Genomic records that represent

an assembly which does not

reflect the structure of a real

biological molecule. The

assembly may represent an

unordered assembly of unplaced

scaffolds， or it may represent

an assembly of DNA sequences

generated from a biological

sample that may not represent a

single organism。

本文标签：序列特性获得核酸物种

版权声明：本文标题：NCBI中各符号代表的意思内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/free/1703353409h448124.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

NCBI中各符号代表的意思

更多相关文章

一日一词:英语中的买与卖 buy purchase sell

传奇升的武器代码

keras conv1d 参数

series函数中使用可变行号

g npt zg m的区分方法

2022葡萄牙vs瑞士实力分析

2022年卡塔尔世界杯8进4规则大全

生物信息学学习心得

cary什么意思

python中range函数的用法

核酸序列分析软件介绍

pcr序列拼接软件contigexpress使用简介

群星种族特性系统介绍:生物学特性与领导人物特性

阅读源码系列:sklearn中train_test_split使用及源码学习

为VMware Esxi 选择合适的存储

IT售前题目汇总-带答案-80%准确率

05-14 第五节 RNA的种类和结构

IBM ServeRAID阵列卡介绍与分类

有效的xp sp3 专业版序列码，方便虚拟机xp系统需求

操作系统-死锁（预防、安全序列、银行家算法图解、检测及解除）

发表评论

推荐文章

论文放高清labview程序截图labview程序导出成png（笔记）

二分查找及其变种

成功率很高的硬盘坏道软修复方法——————【Badboy】

Windows下程序的自启动脚本bat(教你直接用)

Win10开机自动进入修复界面？三种方法助你恢复正常

热门文章

win10系统时间同步、事件设置、时间服务器的同步方法

en: wr

【archlinux】安装向日葵

马哥第三周作业

Vue之模板语法(上)

SQLAlchemy的使用(四)

hiding from the rain and snow

移动硬盘启动win7蓝屏7b_困扰我朋友半年WIN10蓝屏问题，终于解决了！终止代码：pnp detected fatal error...

本地服务器必须加入域才能完成远程桌面安装_ibm system x3650 m2 服务器通过局域网抓包获取IP地址...

windows embedded下载地址收集

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

（Windows系统）详细介绍Windows系统含有英文版