目前表观遗传学(Epigenetics)通常被定义为基因表达通过有丝分裂或减数分裂发生了
可遗传的改变, 而DNA 序列不发生改变[1, 2]。表观遗传学的机
制主要包括DNA 甲基化、组蛋白修饰及非编码RNA。DNA 甲基化(DNA methylation)是指
在DNA甲基转移酶(DNA-methyltransferases, DNMTs)的催化下, CpG 二核苷酸中的胞嘧
啶被选择性地添加甲基, 形成5-甲基胞嘧啶[3, 4]。DNA 甲基转移酶有两种, 其中
DNMT1 主要起维持甲基化的作用, 能使半甲基化的DNA 双链分子上与甲基胞嘧啶相对应
的胞嘧啶甲基化, 可参与DNA 复制双链中新合成链的甲基化[5]; 而DNMT3a 和DNMT3b
主要起形成甲基化的作用, 能在未发生甲基化的DNA 双链上进
行甲基化[6]。DNA 甲基化一般与基因的沉默相关,DNA 去甲基化则与基因的活化相关[7
~9]。
组蛋白修饰(Histone modifications) 是指组蛋白的基础氨基末端尾部突出于核小体,
常在转录后发生变化, 包括甲基化、乙酰化、磷酸化和泛素化等翻译后的修饰, 这些修
饰构成了丰富的“组蛋白密码”(Histone code), 能影响染色质的压缩松紧程度,因此
在基因表达中起重要的调节作用[10, 11]。其中甲基化是组蛋白重要的修饰方式, 多发
生于组蛋白H3、H4 的赖氨酸(K)和精氨酸(A)残基上, 组蛋白赖氨酸甲基化既可以导致
激活, 也可以导致抑制, 通常取决于它所位于的残基情况。如H3K9、H3K27和H4K20 甲
基化一般与异染色质形成有关, 是学者们熟知的重要的“失活”标记物(Hallmark), 而
“活性”标记物则包括H3K4 及H3K36 的甲基化[12~15]。
乙酰化也是组蛋白重要的修饰方式, 多发生于N-末端保守的赖氨酸残基上, 如组蛋白H3
上的9号和14号赖氨酸残基, H4上的5号、8 号、12号和16号赖氨酸残基, 组蛋白H3和H4
上赖氨酸的乙酰化与活化或开放的染色质有关。与此相反, 赖氨酸残基经脱乙酰作用
导致染色质压缩和基因的失活[11]。不同的组蛋白修饰之间可以相互影响, 并与DNA 甲
基化相互作用[11, 16,17]。
非编码 RNA( Non-coding RNAs) 是指不能翻译为蛋白的功能性RNA 分子, 分为看家非
编码RNA(Housekeeping non-coding RNA)和调控非编码RNA(Regulatory non-coding
RNA), 其中具有调控作用的非编码RNA按其大小主要分为两类]18, 19]: 短链非编码RNA
(包括siRNA、miRNA、piRNA)和长链非编码RNA(Long non-coding RNA, lncRNA)(表1)。
尽管近年来大量研究表明非编码RNA 在表观遗传学修饰中扮演了重要的角色, 能在基因
组水平及染色体水平对基因表达进行调控, 决定细胞分化的命运[20~25](图1), 但相对
于其他生物(酵母、果蝇、线虫及植物等), 哺乳动物细胞中表观遗传学的研究相对滞后
。本文将重点综述上述4种非编码RNA 在哺乳动物细胞中对表观遗传学的调控作用。
图1 非编码RNA 在表观遗传学中的作用
1 siRNA
siRNA 来源于长的双链RNA 分子(包括RNA 病毒复制子、转座子或转基因靶点等), 经
Dicer 酶剪切为21~25 nt 的双链RNA 片段, 装载至AGO 蛋白
而发挥作用[26, 27](图2a)。
近年研究表明, siRNA 能在哺乳动物细胞中介导DNA 甲基化和组蛋白修饰, 从而导致转
录基因沉默(Transcriptional gene silencing, TGS)[28~32]。Kawasaki等[30]首先合
成了靶向CpG 岛E-cadherin 基因启动子的siRNA, 通过亚硫酸氢盐修饰结合测序法(
Bisulphite sequencing)证实, 同源siRNA 转染的细胞(人乳腺癌细胞MCF-7 和人正常
乳腺细胞), 其靶标DNA 发生了特异性的甲基化及组蛋白H3K9 的甲
基化, 而且该沉默依赖于DNMT1/DNMT3b, 提示基因沉默发生于转录水平, 是由DNA 甲基
化引起的。Morris 等[31]研究结果表明靶向延长因子1α
(Elongation factor 1alpha, EF1A) 启动子的siRNA能够导致TGS, 其机制与靶标的DNA
甲基化密切相关, 进一步证实了哺乳动物细胞内siRNA 介导的TGS 的保守性。
但有实验报道[33]:
TGS 过程中并未发生DNA 甲基化, 提示DNA 甲基化并非参与所有小RNA 介导的TGS, 或
者是DNA 甲基化在暴露于小RNA 的过程中发生了变化。最近Morris 实验室[34]的研究
结果表明: 以siRNA 持续作用于人泛素C(Uboquitin C,UbC)基因启动子至少3 d, 可导
致长期的基因沉默,靶标首先发生组蛋白甲基化, 随后是DNA 的甲基化,即靶标DNA 甲基
化的检出明显迟于组蛋白修饰, 这在一定程度上可以解释并非所有的siRNA 介导的TGS
中都能检测到DNA 的甲基化。同时提示, 相对于组蛋白修饰而言, 启动子的DNA 甲基化
是一个更容易遗传、更长久的沉默, 即DNA 甲基化主要在维持长期的基因沉默方面起作
用[35]。
为探讨哺乳动物细胞内siRNA 介导的TGS 机制, Morris 等[36, 37]进一步研究了靶标
启动子的组蛋白甲基化、转录的依赖性以及siRNA 的双链是否均参与了TGS, 实验结果
表明siRNA 能引起靶标启动子EF1A 区域H3K9 和H3K27 的甲基化, 而且靶向启动子的
siRNA 中, 只有其21 bp 的反义RNA 链—— 引导链(Guide strain) 对于TGS 是必需的
, 且其主动转录需要RNA 多聚酶II(RNA polymerase II, RNAPII)的参与。
目前研究表明: Argonautes 蛋白家族 (AGO1 及AGO2), DNMT3a, 组蛋白去乙酰化酶(
Histone deacetylase-1, HDAC-1)和/或Polycomb 蛋白家族(Polycomb group, PcG)的
EZH2 (Enhancer of zeste
homolog 2)参与了siRNA 诱导的TGS [30, 37~39]。
哺乳动物细胞内有4 种AGO, 其中主要是AGO1及AGO2 参与TGS, AGO1 虽然与AGO2 的同
源性为80%, 但它缺乏一个关键的催化酶, 不能有效地
裂解RNA, 因此对于AGO1 及AGO2 的选择可能依赖于小RNA 与靶标之间的互补性[38]。
通常完全互补的dsRNA 前体诱导的染色质重塑是由AGO2 引发,而发卡状的dsRNA 前体诱
导的染色质重塑是由AGO1 引发[40]。有意义的是, AGO 在TGS 中的作用早于靶标启动
子的组蛋白甲基化, 当靶标沉默态组蛋白修饰( H3K9 甲基化)增加时, AGO-1 明显减少
,证明AGO1 及 RNAPII 对H3K9 的双甲基化是必需的[37]。
EZH2 作为组蛋白甲基转移酶, 在一定程度上能够引起H3K27 的甲基化, 而甲基化的
H3K27 作为锚点可募集多余的PcG, 从而参与沉默态染色质的形成, 导致TGS[39]。染色
体免疫沉淀结果表明:
DNMTs 与EZH2 抑制的基因之间的结合依赖于EZH2 的存在; 亚硫酸氢盐修饰结合直接测
序结果也证明EZH2 对于其靶向的启动子甲基化是必需的,
提示EZH2 作为募集DNA 甲基转移酶的平台, 参与了DNA 的甲基化。研究报道, 在某些
基因的靶标启动子内DNMT3a 能与小RNA发生免疫共沉淀, 表明
DNMT3a 也参与了靶标启动子的TGS[36]。
总之, TGS 的建立与维持需要多种不同的蛋白:
通常AGO1、DNMT3a 及HDAC-1 对于起始的沉默是必需的, 而DNMT1 对于维持沉默是必需
的[34]。
已知 RNAPII 参与了小RNA 介导的TGS, 研究报道RNAPII 与AGO1 免疫共沉淀于启动子
区域, 但尚不清楚RNAPII 是如何发挥作用的。目前研究主
要集中为两种模型。
第一种为RNA-RNA 模型(图3A):
其主要特征是RNA 引导链与RNAPII 合成的低拷贝转录子结合, 从而导致沉默。近来更
多的研究支持这一模型, 其中一个关键的实验是应用对siRNA 敏感的INK4/ARF 位点的
调节域(Regulatory domain, RD)作为实验平台, 研究siRNA 介导的RD染色质重塑, 结
果显示其重叠转录是靶向转录链而非模板链, 而且完全互补的双链RNA 前体及不完全互
补的双链RNA 前体均可介导异染色质的形成[41]。
另有研究结果表明经RNAPII 合成的低拷贝转录子,可被siRNA 的引导链识别, 并作为识
别域引导沉默复合物至启动子区域导致TGS[29]。以互补的硫代磷酸酯寡核苷酸 (
Phosphorothioate oligonucleotides,
PS-ODNs) 封闭这些低拷贝转录子, 可终止siRNA靶向的启动子沉默。
第二种为RNA-DNA 模型(图3B): 其主要特征是在转录过程中, RNA 引导链与靶标的一条
DNA 形成二聚体, 从而导致沉默。支持该模型的直接证据包括: RNAPII 能与TATAA 转
录起始点上游松解的核小体结合, 从而参与TGS[42], 以及DNMT3b 直接参与了siRNA 介
导的TGS[30]。事实上, 这两种模型并非相互排斥, 可能是siRNA 参与了不同的功能过
程, 当siRNA 直接靶向TATAA或RNPII 结合位点时, 以RNA-DNA 方式介导TGS,
而大多数情况下siRNA 是以RNA-RNA 方式发挥作用。
图 3 RNA 基因沉默的作用模式(人细胞)[35]
A: RNA/RNA 模型:
RNA 引导链与RISC(AGO1、Ezh2、DNMT3a 或HDAC-1)结合, 随后与RNAPII 合成的低拷贝
转录子结合, 从而介导TGS。
B: RNA/DNA 模型:
RNA 引导链与RISC(AGO1、Ezh2、DNMT3a或HDAC-1)定位于基因组DNA, 随后与靶标的一
条DNA 形成二聚体, 从而介导TGS。
2 miRNA
miRNA 是长约21~25 nt 的单链RNA, 其中50%定位于易发生结构改变的染色体区域[43]
。最初认为miRNA 和siRNA 的区别主要有两点: (1) miRNA 是内源性的, 是生物体基因
的表达产物; siRNA 是外源性的, 来源于病毒感染、转座子或转基因靶点。(2)
miRNA 是由不完整的发卡状双链RNA, 经Drosha和Dicer 酶加工而成; siRNA 是由完全
互补的长双链RNA, 经Dicer 酶剪切而成[44](图2b)。尽管如此区别,由于miRNA与siRNA
密切相关, 如两者片段大小相近, 均经Dicer 加工后装载至AGO 蛋白而发挥作用,因此
推测miRNA 也能介导TGS, 而且两者的作用机制有所重叠[22, 27, 40]。
目前研究表明: 哺乳动物细胞内miRNA的调控机制反映了miRNA 的特异装载蛋白AGO 以
及miRNA 与mRNA 之间的互补程度[45]。通常只有极少数的 miRNA 与其mRNA 靶标几乎
完全互补, 从而可以经内切酶直接裂解mRNA, 而绝大多数miRNA 与其mRNA 靶标只有部
分互补, 一般为6~7个碱基, 位于mRNA 的5′端的第2~7 位核苷酸, 称为“种子区” (
Seed region), 在与靶标的结合中起重要作用, 因此种子区是筛选靶标的最基本的特异
性的决定因素, 同时不少研究提示一个miRNA 可调控许多甚至上百个不同的基因[45~48
]。 Lewis 等[48]通过对13 000 多个人类基因的研究进一步推测: 组蛋白甲基化酶、
甲基化CpG 结合蛋白、染色质域蛋白及组蛋白去乙酰化酶等均是miRNA 潜在的作用靶标。
已有研究表明miRNA 可通过调控组蛋白修饰引起染色质重塑。有学者报道组蛋白去乙酰
化酶4(HDAC4)是鼠胚胎软骨组织特异的miR-140 的靶标, 提示miRNA 可通过调控组蛋白
的修饰而参与TGS[49]。Kim 等[50]研究发现: 哺乳动物细胞基因组保守的miRNA 之一
—— miR-320(由细胞周期基因POLR3D 启动子上游编码)能引导AGO1 至POLR3D启动子,
同时还有EZH2 及H3K27 三甲基化的参与,以顺式方式诱导TGS, 这进一步证实miRNA可在
哺乳动物细胞内引起TGS。
近来的研究进一步证明miRNA 可通过调控DNA 甲基化酶的表达而影响DNA 甲基化。
Fabbri等[51]研究发现在非小细胞癌内, miR-29 家族(包括
miR-29a、miR-29b 和miR-29c)的表达是下调的, 而DNMT3a、DNMT3b 处于高表达状态,
miR-29 家族与DNMT3a、DNMT3b 的3′UTR 端的互补性提示DNMT 的mRNAs 是miR-29 家
族的作用靶点。
Benetti 等[52]及Sinkkonen 等[53]的研究均表明Dicer缺失鼠胚胎干细胞内, DNMT3a
、DNMT3b 表达的下调是依赖于miR-29 家族, 其主要机制是: Dicer 酶的缺失使miR-29
家族表达下调, 而miR-29 家族可抑
制视网膜母细胞瘤样蛋白2(Retinoblastoma-likeprotein 2, Rbl2) 的表达, 后者通过
抑制DNMT3a、DNMT3b 的活性, 使DNA 甲基化缺失, 同时提示miR-29 通过增强抑癌基因
的表达而抑制肿瘤的发生。Gonzalez 等[41]研究结果显示: 哺乳动物细胞的肿瘤miRNA
—miR17-5p 及miR20a 能在具有重叠转录功能并与miRNA 种子区互补的启动子区域诱导
异染色质的形成, 进一步揭示了miRNA 调控的染色质重塑和基因转录的新机制。上述研
究将有助于我们更加全面真实地阐明肿瘤的发生机制, 为寻找肿瘤治疗的新靶点提供一
个全新的视野。
3 piRNA
piRNA 是近年来在哺乳动物细胞内发现的长度约为24~31 nt 的RNA 分子, 因在生理状
态下能与Piwi 蛋白偶联, 故命名为piRNA(Piwi interacting RNA, piRNA)[54~56]。由
于Piwi 为一表观遗传学调控
因子, 能与PcG 蛋白共同结合于基因组PcG 应答元件上, 协助PcG 沉默同源异型基因,
因此推测与Piwi相关的piRNA 也应具有表观遗传学的调控作用[57]。
研究表明哺乳动物细胞piRNA 分为两个亚簇[7~9, 58, 59]: 一是粗线期piRNA簇: 主要
出现于减数分裂的粗线期, 持续表达至单倍体精子细胞阶段,
一般很少有重复片段; 二是粗线前期piRNA 簇: 主要出现于减数分裂前的生殖细胞, 虽
然具有粗线期piRNA 簇的分子特征, 但来源于一个完全不同的簇,与果蝇及斑马鱼的
piRNA 相似, 具有重复片段。大多数piRNA 的5′端有单磷酸化基团而且偏爱尿嘧啶碱
基(> 84%), 3′端有2′O –甲基修饰, 其生物学意义仍不清楚, 推测可能对piRNA 的
稳定性及功能至关重要。
目前 piRNA 的生物合成和作用机制尚不清楚。鉴于piRNA 的作用不依赖于Dicer 酶,
哺乳动物细胞粗线期piRNA 簇具有明显的链不对称性, 提示
piRNA 来源于单链前体, 而非双链分子[60, 61]。因此产生两种假说: 一是piRNA 由长
单链分子产生; 二是piRNA 可能为初级转录产物。Aravin 等[59]通过鼠细胞内的实验
证据提出哺乳动物细胞piRNA 的自我扩增模型, 与果蝇扩增模型不同的是: 基因簇并非
初级piRNA 的主要来源, 而是由转座子mRNA 产生初级正义piRNA 参与扩增循环(图2c)。
已有研究表明DNA 甲基酶家族(DNMT3a、DNMT3b 及DNMT3L)在转座子甲基化的形成中起
主要作用, 其中DNMT3a 和DNMT3b 的催化活性在
生殖细胞及体细胞内均非常重要, DNMT3L 则是生殖细胞内甲基化形成的一个核心调控
子[6, 62]。实验发现鼠的MILI 和MIWI2 蛋白对于其睾丸中
LINE-1 和IAP 转座子成分的沉默是必需的, MILI 或MIWI2 的缺失可以使转座子甲基化
标识丢失, 而且突变鼠的表型与DNMT3L 缺失鼠的表型一致; 在甲基化形成的关键时期,
MIWI2 始终定位于细胞核内;
小RNA 序列分析显示MILI 和MIWI2 均作用于DNMT3L 的上游, 随后作用于DNMT3a 和
DNMT3b的上游。上述实验结果证实Piwi/piRNA 复合体能介
导转座子甲基化的形成, 且Piwi 途径位于DNA 甲基化调节因子的上游, piRNA 是生殖
细胞内DNA 甲基化的特异性决定子[63~65]。目前在果蝇中的研究已表明Piwi 能通过直
接募集染色质结构域蛋白HP1a而参与异染色质的形成(H3K9 甲基化), 但在哺乳动物细
胞内尚无类似研究报道[66]。
4 lncRNA
lncRNA一般是指大于200nt 的RNA, 不参与或很少参与蛋白编码功能, 位于细胞核内或
胞浆内[67, 68]。
通常分为5 类: 即正义(Sense)、反义(Antisense)、双向(Bidirectional)、基因内(
Intronic)及基因间(Intergenic)
lncRNA[18]。
lncRNA 有多种不同的来源, 目前认为可能是[18]
(1)编码蛋白的基因结构中断而转变为lncRNA;
(2) 染色质重组的结果, 即两个未转录的基因与另一个独立的基因并列而产生含多个外
显子的lncRNA;
(3) 由非编码基因复制过程中的反移位产生;
(4)由局部的串联复制子产生邻近的非编码RNA;
(5)基因中插入一个转座成分而产生有功能的非编码RNA。尽管众多的lncRNA 没有共同
的起源, 但研究表明它们在基因表达的调控方面起着相似的作用[68]。
哺乳动物细胞内lncRNA 调控的表观遗传学研究, 最早源于基因组印记(Genomic
imprinting) 和X染色体失活(X chromosome inactive), 分别与H19 和Xist RNA 密切
相关[69, 70]。H19 作为基因组印记的、母
源表达的lncRNA, 经过剪接及多聚腺苷酸化后输送至胞浆内, 并可累计达到较高浓度。
虽然H19 是第一个发现的与基因组印记密切相关的基因, 但H19
的功能至今尚不明确。近来有学者在人和鼠细胞中发现H19 RNA 是 miR-675 的前体[71
], 提示H19 RNA可能通过miRNA 发挥基因调控作用。基因组印记除了与H19 基因簇有关
, 还有Kcnq1ot1、Air 及 Nespas
基因的参与, 它们通常是父源表达的, 通过卵母细胞中启动子的DNA 甲基化抑制母系等
位基因的表达[72~74]。Kcnq1ot1 和 Air 启动子的缺失实验结果表明, lncRNA 或其转
录产物分别对于Kcnq1ot1 和lgf2r/Air 印记基因簇的沉默是必需的, 而且对长达800bp
的印记基因簇抑制性组蛋白标记(H3K27 三甲基化和 H3K9 双甲基化)以及某些基因的
DNA甲基化
也是必需的[74, 75]。
Xist RNA(17 kb 长的非编码RNA)对于哺乳动物细胞内X 染色体失活非常重要, 但Xist
并不输送至胞浆, 而是与即将被它失活的X 染色体的某个RNA结构域或成分相连, 在失
活染色体表面形成“外套”(Coating)并以顺式方式介导基因沉默[70, 76]。目前认为
Xist RNA 在没有Pol II 的情况下, 建立了一个特别的核区, 大多数即将被失活的染色
体在此定位并失活, 其基因沉默特征是失去激活性的组蛋白修饰(如乙酰化)而获得抑制
性的组蛋白修饰(如H3K27的三甲基化), 最后, 失活染色体上的许多CpG 岛启
动子甲基化[77]。近来Zhao 等[78]研究表明: RepA(Xist RNA 上的一个1.6 kb 片段),
能通过募集Polycomb 抑制复合物2( Polycomb repressive complex 2, PRC2)并通过
EZH2 靶向将被失活的染色体, 使染色体H3K27 发生三甲基化, RepA 缺失实验表明RepA
对完整的Xist RNA 及H3K27 的甲基化是非常重要的。
有意义的是, 即使在细胞分裂中期, 该“外套”始终以顺式方式与失活的染色体相连,
经多次细胞分裂后, X 染色体失活始终存在[79], 表明RNA“外
套”与组蛋白修饰及DNA 甲基化共同构成表观遗传学的记忆, 从而使失活的染色体进行
有丝分裂。但在体细胞, Xist 基因的缺失并不影响基因沉默, 提示一旦建立了记忆,
lncRNA 诱导的沉默结构域是非必需的。
近来研究表明X 染色体失活和基因组印记可能共享一些基因簇, 其基因沉默的机制不仅
包括顺式作用, 还有反式作用。例如HOX 转录反义RNA (Hox
transcript antisense RNA, HOTAIR), 它来源于HOXC位点, 能以反式方式沉默HOXD 位
点长达40 kb 的基因转录, 主要机制是通过HOTAIR 募集PRC2 至HOXD 位点, 使X 染色
体和Kcnq1 域分别发生H3K9三甲基化, 从而引发异染色质的形成及TGS[80]。
另有研究报道[81]: X 染色体失活尚存在另一机制, 即Xist 和Tsix 复性形成RNA 二聚
体, 经Dicer酶剪切成为小干扰RNA, 其对于失活的X 染色体
上异染色质的修饰是必需的。这两个不同的途径或许可以协调 lncRNA 和小RNA 在染色
质重塑方面的作用, 同时提示RNA 调控存在着一个更为复杂的、交互的网络。
5 结语与展望
随着对非编码RNA 在哺乳动物进化及疾病发生发展中作用的关注, 非编码RNA 作为表观
遗传学调控的新机制, 已成为现代遗传学研究的热点问
题。然而, 迄今为止, 人们对于哺乳动物细胞内非编码RNA 调控机制的了解还十分有限。
最初认为 siRNA、miRNA 及piRNA 的作用途径是独立的, 而且有明显的区别。但近年来
研究报道这些作用途径的界限已开始模糊, 其中有些作用子之间有交互作用, 从而构成
了一个调控网络。那么生物体是如何适应这些多重的调控机制?在解决这个问题之前,
我们必须先弄清楚非编码RNA 本身的详细信息。目前一个关键问题是已有的实验证据仅
代表了庞大的复杂的RNA 调控网络的一个侧面,还是仅对最初的基于蛋白调控机制的补
充?解析这一调控网络和/或单一的非编码RNA 的工作非常艰巨, 需要系统地研究和发
现并分析非编码RNA, 逐步完善并应用全基因扫描技术揭示非编码RNA 表达的全部信息
及功能, 最终目标是阐明哺乳动物细胞内非编码RNA 调控的表观遗传学的详尽机制, 以
及它们在正常细胞以及疾病状态下的交互作用。
目前已知哺乳动物细胞内AGO 是siRNA 和miRNA 的装载蛋白, Piwi 是piRNA 的偶联蛋
白,AGO 和Piwi 蛋白及小RNA 均参与了染色质或DNA
修饰而介导TGS, 但尚不清楚它们是如何靶向其特异的染色质区域以及如何募集修饰酶
?虽然与TGS密切相关的染色质结构域蛋白HP1 在进化过程中
(包括酵母、果蝇及哺乳动物细胞)高度保守, 在酵母及果蝇中的研究亦表明HP1 的同源
物(Swi6 和Chp2)及CD 域结合蛋白Chp1, 均能与甲基化的H3K9 结合并参与TGS, 但在哺
乳动物细胞尚无直接的实验证据。对这些未知的染色质接头蛋白进行生物化学和细胞生
物学分析, 不仅有助于揭示小RNA 对表观遗传学的调控机制, 而且将为临床基因治疗提
供新的有效的靶点。
另一个重要问题是关于piRNA 的生物起源及其生物学功能, 根据目前实验证据提出的
piRNA 自我扩增模型固然成立[27, 59], 但低估了生物合成机制的复杂性。如piRNA 的
3′端修饰是如何产生的?piRNA自我扩增循环是如何调控的?哺乳动物细胞piRNA不同
于果蝇和斑马鱼的piRNA, 只有17%~20%的piRNA 分布于重复序列, 包括转座子和反转座
子,提示可能有其他因子参与piRNA 介导的基因沉默。有必要对这些位点进行遗传学分
析并进一步研究清楚piRNA-Piwi 复合物中的蛋白组分, 从而有助于阐明piRNA 的生物
学功能。今后对piRNA 的生物起源及多种潜在的功能研究, 必将促进我们对piRNA 在哺
乳动物细胞内调控机制的理解。
========================
表1 表观遗传学中起主要调控作用的非编码RNA
种类 长度(nt) 来源主要功能
siRNA ~21~25 长双链RNA 转录基因沉默
miRNA ~21~25 含发卡结构的pri-miRNA 转录基因沉默
piRNA ~24~31 长单链前体或起始转录产物等多途径生殖细胞内转座子的沉默
lncRNA >200 多种途径基因组印记和 X 染色体失活
========================
图 2 siRNA、miRNA 及piRNA 的生物合成[26, 27, 58]
a: (人类)siRNA 来源于长的双链RNA 分子, 经Dicer 酶剪切为21~25 nt 的双链RNA 片
段, Dicer 酶和dsRNA 结合蛋白将siRNA 二聚体装载至Argonaute 蛋白(AGO2)而发挥作
用;
b: (人类)miRNA 由内源性的生物体基因产生含有发卡结构的65~70 nt 长的pri-miRNA,
该发卡结构在细胞核内经Drosha-DGCR8 复合物加工产生pre-miRNA。在细胞浆内, pre
-miRNA 进一步经Dicer 酶剪切为miRNA-miRNA*二聚体 (其中miRNA为引导链, miRNA*
为信息链), 装载至Argonaute 蛋白1(AGO1) 而发挥作用。
C: (鼠类) piRNA 的生物合成尚不清楚。piRNA 来源于单链RNA前体, 而且不依赖于
Dicer 酶。产生的初级正义piRNA 倾向于与 MILI 结合, 在出生前的睾丸、MILI 和
MIWI2 均参与复制周期, 在次级反义piRNA 中MIWI2 比MILI 更为丰富, 次级反义piRNA
可能直接裂解转座子mRNA。