基因结构图详解-美格生物让你五分钟看懂基因的结构-基因图的秘密

Magigen
2021-12-06

基因是什么?


基因, 英文Gene,是具有遗传效应的DNA分子片段,是DNA分子上有遗传效应的特定核苷酸序列的总称。

基因是遗传变异主要物质,她储存着生命从孕育、生长、凋亡过程的全部信息,通过复制、转录、表达,完成细胞分裂、蛋白质合成等重要生理过程。


基因结构是怎样的?基因图详解


Magigen准备从DNA、preRNA、mRNA这三个方面来分析基因的结构:

基因的结构图


图1. 基因结构图


一、DNA

由图1的基因图可以看到,基因结构主要是由编码区和非编码区两部分组成,非编码区位于编码区的上游和下游,又叫做侧翼序列。


编码区 Coding region

自起始转录密码位点至转录终止密码位点的一般DNA序列称为编码区。编码区含有若干段编码/顷序,是该基因表达为多肽链的部分,称为外显子。

真核生物的编码区是不连续的,分为外显子和内含子,其间有不编码的间隔顺序隔开,间隔顺序称为内含子,在转录过程中会修剪内含子,在初级转录物加工时被切掉,拼合外显子,形成转录产物。因此,结构基因又称为不连续基因或断裂基因。如果一个基因结构含有k个内含子,则含有k+1个外显子,但内含子的核苷酸的数量可比外显子多许多倍。也有少数真核生物的基因结构没有内含子,例如组蛋白基因、干扰素基因等。

而在原核生物中,基因则是连续的,也就是说没有外显子和内含子之分。


外显子 Exon

外显子是在 preRNA 经过剪切或修饰后、被保留的DNA部分,并最终出现在成熟RNA(mature RNA)的基因序列中。


内含子 Intron

在真核生物中,内含子Intron作为隔断基因的线性表达的一段DNA序列,是在preRNA经过剪切或修饰后,被切除的DNA序列。


非编码区 Non-coding region

非编码区在对基因的表达调控中发挥重要作用,如启动子、增强子、终止子等都位于这个区域。在人类基因中,非编码区所占的比例超过90%。它们中的一部分可以转录为功能性RNA,比如tRNA(transfer RNA), rRNA(ribosomal RNA)等,可以作为DNA复制,转录起始,来对复制,转录和翻译起到调控作用;也可能是着丝粒与端粒的重要组成部分。


启动子Promoter

启动子Promoter是特定基因转录的DNA区域,启动子一般位于基因的转录起始位点,5'端上游,启动子长一般约100-1000bp。在转录过程中,RNA聚合酶与转录因子可以识别、并特异性结合到启动子特有的DNA序列,这些序列一般是保守序列,从而启动转录。启动子本身并不转录,也不控制基因活动,而是通过转录因子结合,来调控转录过程。在细胞核中,似乎启动子优先分布在染色体区域的边缘,可能是在不同染色体上共同表达基因。 此外,在人类中,启动子显示出每个染色体特有的某些结构特征。


CAAT Box与Sextama box

CCAAT box,又称为CAAT box或CAT box,它具有GGCCAATCT 共有序列的不同核苷酸序列 ,是真核生物基因常有的调节区,位于转录起始位点上游约-80bp处,可能也是RNA聚合酶的一个结合处,控制着转录起始的频率。与之相似的是,在原核生物启动子上-35bp处的TTGACA区,又称-35区。


保守序列与共有序列有一些差别。保守序列间相似度高,但不一定相同,而共有序列是相同的,共有序列可以理解为一种特殊的保守序列。

CAAT框是最早被人们了解的常见启动子元件之一,常位于接近-80的位置处,但是它可以在离起始点较远的地方仍能起作用,而且在两种取向均可发挥作用。CAAT框的突变敏感性显示了它在决定转录效率上有很强的作用,但是突变对启动子的特异性没有影响。


TATA Box与Pribnow box

TATA框,TATA box / Goldberg-Hogness box),是存在于古细菌和真核生物的核心启动子区域的一段DNA序列。TATA 框的原核同源物称为Pribnow框,Pribnow box,它具有较短的共有序列TATAATAAT。 它位于多数真核生物基因转录起始点上游约-25至-32bp位置处,基本上由A-T碱基对组成,决定基因转录起始的选择,是RNA聚合酶的结合处之一,RNA聚合酶与TATA框牢固结合之后才能起始转录。


增强子Enhancer

增强子是位于转录起始位点或下游基因1Mbp的位置、长度50-1500bp的序列,它可以被转录激活因子结合,从而增加特定基因转录发生的可能性,它广泛的存在于原核与真核生物基因结构中。它可以大大增强启动子的活性。

增强子与启动子相同之处:两者都是表达调控的顺式作用元件。增强子与启动子不同的地方是: 启动子是转录起始位点上游与RNA聚合酶结合的一段DNA序列,而增强子是与启动子作用增强转录的一些片段。增强子的位置不固定,能有很大的变动,可以在启动子下游或上游,它能在两个方向产生相互作用。一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子。


终止子 Terminator

终止子位于基因或操纵子的末端,是给RNA聚合酶提供转录终止信号的DNA序列。

终止子与终止密码子二者在名称上相似,但是含义是完全不同的。终止子是处于基因的非编码区的一段DNA序列,用于终止转录。而终止密码子是在翻译过程中终止肽链合成的mRNA中的三联体碱基序列,一般情况下为UAA,UAG和UGA,不编码为氨基酸。


回文序列Palindrome sequence

回文序列是双链DNA中的一段倒置重复序列。该序列有个特点,它的碱基序列与其互补链之间正读和反读都相同。当该序列的双链被打开后,如果这段序列较短,有可能是限制性内切酶的识别序列;如果比较长,有可能形成发卡结构,这种结构的形成有助于DNA与特异性DNA与蛋白质的结合。

回文序列示例:

5' GGTACC 3'

3' CCATGG 5'


ATAAA

ATAAA是preRNA在通过修剪后形成成熟mRNA时,在3'UTR产生PloyA时的加尾信号。但是这段序列并不是绝对保守,也可能为其他A富集的序列,比如AATAAA等。


二、preRNA

开放阅读框 Open reading frame(ORF)

开放阅读框是连续的一段密码子,其含有起始密码子(通常是AUG)和终止密码子(通常是UAA,UGAUAG)。在真核基因中,开放阅读框ORF跨越内含子/外显子区域,其可以在ORF转录后拼接在一起,以产生蛋白质翻译的最终mRNA。 由于读写位置不同,对应不同的起始位点,开放阅读框ORF可能翻译为不同的多肽链。


转录起始位点 Transcription start sites (TSS)

转录起始位点是指与新生RNA链第一个核苷酸相对应的DNA链上的碱基,通常为一个嘌呤(A 或G),即5’UTR的上游第一个碱基。

5’末端的序列称为上游, 而把其后面即3‘末端的序列称为下游.


转录终止位点 Transcription termination sites (TTS)

转录起始位点是指新生RNA链最后一个核苷酸相对应的DNA链上的碱基。当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二酯键,RNA-DNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来。



三、mRNA

5'UTR 与 3'UTR

这里需要注意的是外显子包含UTR区,也就是说外显子不只有可编码的序列,而且包含非编码序列。

UTR (Untranslated Region ),非翻译区,能转录不翻译,UTR也属于外显子的一部分。如果这段序列位于5'端,就称作5'UTR(5‘-untranslated region),也叫前导序列leader。相反若位于3'端,就叫它3'UTR(3‘-untranslated region),也叫尾随序列(trailer)。1978年,人类γ球蛋白mRNA的5′非翻译区被成功完全测序 。1980年,又开启了人类α-珠蛋白基因中3′非翻译区的研究。虽然被叫做非编码区,但是5′非翻译区内的上游可读框却可以被翻译成多肽 。

5'UTR 位于从mRNA起点的甲基化鸟嘌呤核苷酸帽,延伸至起始密码子AUG,3'UTR从编码区末端的终止密码子,延伸至多聚A尾巴(Poly-A)的前端。

原核生物和真核生物都可以看到非翻译区UTR,但它们的长度和组成都有所不同。原核生物中,5′非翻译区通常为3至10个核苷酸的长度。但在真核生物中,5′非翻译区有成百上千个核苷酸的长度。与原核生物相比,真核生物的基因组的复杂性更高,3′非翻译区的长度也不同。虽然5′非翻译区和3′非翻译区UTR在长度上有差异,但5′非翻译区UTR的长度在演化过程中比3′非翻译区显得更保守。


5'帽 /5' Cap

5' 也被称为7-甲基鸟苷酸帽,缩写为m7G。这种结构在RNA进出细胞核起到识别作用;可以抗5'-核酸外切酶的截切;促进5’端内含子的切除;在翻译过程中, 有助于核糖体对mRNA的识别和结合。


CDS (coding dna sequence)

CDS 是基因中DNA或RNA为蛋白质编码区域,该区域通常开始于5‘末端的起始密码子,并结束于3’端的终止密码子。生物体基因组编码区的总和称为外显子组。


3' PolyA tail

Poly A tail 由多个腺苷一磷酸组成 ,也就是说它是一段仅含有腺嘌呤碱基的RNA 。这种结构可以避免细胞质中的酶促降解,保护mRNA, 免受核酸外切酶攻击,对转录终止、将mRNA从细胞核输出和进行翻译都非常重要。


相关阅读


构建3D细胞结构的好方法

利用CRISPR–Cas12b进行高效的植物基因工程编辑

用基因改造的细菌来治疗糖尿病等疾病


美格生物部分热销试剂价格

试剂盒名称编码容量大小试剂价格
Magicscript 耐热逆转录酶 IIA001S100µl, 200U/µl498
Magicscript RNA酶抑制剂A002S100µl, 40U/µl320
Magicscript 耐热逆转录酶 IIIA003S100µl, 200U/µl1580
Rnase H(E.coli)A004S250U320
一步法RT-qPCR预混液IIA014S100T798
抗体修饰热启动 Taq 1.0 DNA 聚合酶(带基础 buffer)A016S250U, 5U/µl385
Taq 1.0 DNA 聚合酶(带基础 buffer)A015S250U, 5U/µl190
化学修饰热启动 Taq 1.0 DNA 聚合酶(带基础 buffer)A017S250U, 5U/µl385
CRISPR Cas12a (Cpf1)C001S70pmol/盒580
CRISPR Cas9C002S70pmol/盒489
CRISPR Cas12bC006S100pmol/盒1480
CRISPR Cas13aC005S100pmol/盒1280
CRISPR Cas14aC015S100pmol/盒1280
T7 Endonuclease IC007S250U/盒549
单链DNA荧光报告探针C009S50 test139
单链RNA荧光探针C011S50 test239
耐热 Rnase HIIA006S250U1299
2X LAMP Amplication Mix(with dye)F001S50T1299
鼠尾基因型鉴定试剂盒A010M100次498




分享