Page 240 - 第九版生物化学
P. 240
第十—章真核基因与基因组 225
上游 上游 / I \ ~外显子(编码序列) 终止密码下游 下游
增强子 V 侧翼区 增强子
I 侧翼区
5' 3'
启动子I l 卢始密码二二I II II I I I jI \聚A信号
5' 非翻译区 3' 非翻译区 伐 kky,2018 安.., , 201 ,
\ I
mRNA结构 亡] 一一■亡]
图 1 1-1 真核生物断裂基因
因序列中,出现在成熟 mRNA 分子上的序列称为外显子 (exon); 位于外显子之间、与 mRNA 剪接过
程中被删除部分相对应的间隔序列则称为内含子 (intron) 。 每个基因的内含子数目比外显子要少
1 个 。 内含子和外显子同时出现在 最 初合成的 mRNA 前体中,在合成后被剪接加工为成熟 mRNA
(见第十四章) 。 如全长为 7 . 7kb 的鸡卵清蛋白基因有 8 个外显子和 7 个内含子,最初合成的
mRNA 前体与相应的基因是 等 长的,内含子序列被切除后的成熟 mRNA 分子的长度仅为 1. 2kb 。
不同的基因中外显子的数 量 不同,少则数个,多则数十个 。 外显子的数量是描述基因结构的重要
特征之一 。
原核细胞的基因基本没有内含子 。 高等真核生物绝大部分编码蛋白质的基因都有内含子,
但组蛋白编码基因例外 。 此外,编码 rRNA 和一些 tRNA 的基因也都有内含子 。 内含子的数量
和大小在很大程度上决定了高 等真 核生物基因的大小 。 低等 真 核生物的内含子分布差别很大,
有的 酵 母的结构基因较少有内含子,有的则较常见 。 在不同种属中,外显子序列通常比较保守,
而内含子序列则变异较大 。 外显子与内含子接头处有一段高度保守的序列,即内含子 5, -末端
大多数以 GT 开始, 3, -末端大多数以 AG 结束,这 一 共有序列 (consensus sequence) 是真核基因中
RNA 剪接的识别信号 。
为方便叙述基因编码序列和其调节序列的关系,人们约定将一个基因的 5, _端称之为上游, 3, _端
称为下游;为标定 DNA 信息的具体位 置 ,将基因序列中开始 RNA 链合成的第一个核昔酸所对应的碱
基记为 +1, 在此碱基上游的序列记为负数,向 5' -端依次为 -1 、 - 2 等;在此碱基下游的序列记为正数,
向 3'-端依次为 +2 、 +3 等 。零 不用千标记碱基位置 。
二、基因编码区编码多肤链和特定的 RNA 分子
基因编码区中的 DNA 碱基序列决定一个特定的成熟 RNA 分子的序列,换言之, DNA 的一级结构
决定着其转录产物 RNA 分子的一级结构 。 有的基因仅编码 一 些有特定功能的 RNA, 如 rRNA 、 tRNA
及其他小分子 RNA 等;而大多数基因则通过 mRNA 进一步编码蛋白质多肤链 。 无论是编码 RNA 还
是编码蛋白质,基本原则是基因的编码序列决定了其编码产物的序列和功能。因此,编码序列中一个
碱基的改变或突变,都有可能使基因功能发生重要的变化 。 这些变化可能是原有功能的丧失,或是新
功能的获得 。 当然,也有的碱基 突 变不会影响编码产物的序列或功能。
需要指出的是,有些相同的 DNA 序列由千其起始位点的变化或 mRNA 不同的剪接产物可以编码
不同的蛋白质多肤链 。
三、调控序列参与真核基因表达调控
位千基因转录区前后并与其紧邻的 DNA 序列通常是基因的调控区,又称为旁侧序列 (flanking se- ~飞牙}