Page 244 - 第九版生物化学
P. 244
第十一章 真核基因与基因组 229
二、真核基因组中存在大量重复序列
真核细胞基因组存在着大量重复序列,人基因组中,重复序列占基因组长度的 50% 以上 。 重复 免 kk y ,20 18
序列的长度不等,短的仅含两个碱基,长的多达数百乃至上千个碱基 。 重复序列的重复频率也不尽相
同,可以分为高度重复序列 (highly repetitive sequence) 、 中度重复序列 (moderately repetitive sequence) 矿,t)
和单拷贝序列 (single copy sequence) 或低度重复序列等 3 种 。
(一)高度重复序列
高度重复序列是真核基因组中存在的有数千到几百万个拷贝的 DNA 重复序列 。 这些 鹰息扂 列
的长度为 6 - 200bp, 不编码蛋白质或 RNA 。 在人基因组中,高度重复序列约占基因组长度的 20% 。
高度重复序列按其结构特点分为反向重复序列 (inverted repeat sequence) 和卫星 DNA(satellite DNA) 。
前者由两个相同顺序的互补拷贝在同一 DNA 链上反向排列而成,反向重复的单位长度约为 300bp 或
略短,其总长度约占人基因组的 5%' 多数是散在,而非群集千基因组中 。 卫星 DNA 是真核细胞染色
体具有的高度重复核昔酸序列,主要存在千染色体的着丝粒区,通常不被转录,在入基因组中可占
10% 以上 。 由于其碱基组成中 GC 含量少,具有不同的浮力密度,在氯化绝密度梯度离心后呈现出与
大多数 DNA 有差别的“卫星”条带而得名 。
高度重复序列的功能主要是:心参与复制水平的调节 。 反向重复序列常存在千 DNA 复制起点区
的附近,是一些蛋白质(包括酶)的结合位点 。 @参与基因表达的调控。高度重复序列可以转录到核
内不均 -RNA 分子中,而有些反向重复序列可以形成发夹结构,有助千稳定 RNA 分子 。 @参与染色
体配对 。 如 a 卫星 DNA 成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对
有关 。
(二)中度重复序列
中度重复序列指在真核基因组中重复数十至数千次的核昔酸序列,通常占整个单倍体基因组的
1% -30% 。 少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列 。 依据重复序列的
长度,中度重复序列可分为以下两种类型 。
1. 短散在核元件 短散在核元件 (short interspersed nuclear elements, SINEs) 又称为短散在重复序
列 (short interspersed repeat sequence) , 是以散在方式分布于基因组中的较短重复序列,平均长度约为
300 -500bp, 与平均长度约为 lOOObp 的单拷贝序列间隔排列 。 拷贝数可达数十万 。 如 Alu 家族, Kpn
1 家族和 Hi可家族等属千这种类型的中度重复序列 。
Alu 家族是哺乳类动物,包括人基因组中含量最丰富的一种短分散片段中度重复序列,平均每
6kb DNA 就有一个 Alu 序列,在单倍体人基因组中重复达 30 万 -50 万次,约占人基因组的 3% -6% 。
Alu 家族每个成员的长度约 300bp, 由千每个单位长度中有一个限制性核酸内切酶 Alu 的切点 (AG!
CT), 将其切成长 130bp 和 170bp 的两段,因而命名为 Alu 序列(或 Alu 家族) 。
Kpn I 家族是中度重复序列中仅次于 Alu 家族的第 二 大家族,因其重复序列中含有限制性内切酶
Kpn I 的位点、可被水解为 4 个不同长度的片段而命名 。 Kpn I 家族成员呈散在分布,拷贝数约为
3000 -4800 个,占人类基因组的 1% 。
H叫家族以 319bp 长度的串联重复存在于人基因组中,因其重复序列中含有限制性核酸内切酶
Hinfl 的位点而命名 。
2. 长散在核元件 长散在核元件 (long interspersed nuclear elements , LINEs) 又称为长散在重复序
列 (long interspersed repeat sequence) , 以散在方式分布于基因组中的较长的重复序列,重复序列长度
在 lOOObp 以上,常具有转座活性 。
中度重复序列在基因组中所占比例在不同种属之间差异很大,一般约占 10% -40%, 在人约为
12% 。这些序列大多不编码蛋白质,其功能可能类似于高度重复序列 。
真核生物基因组中的 rRNA 基因也属千中度重复序列 。 与其他中度重复序列不同,各重复单位