G-四链体结构是一种非传统的核酸结构,是由富含鸟嘌呤碱基(Guanine)的单链DNA在一价阳离子(如K+和Na+)的稳定下通过G碱基间Hoogsteen 氢键作用形成G-平面并进一步堆积形成的四链体螺旋结构[1]。Balasubramanian课题组[2]研究表明,形成G-四链体的序列通常具有d(G3+N1-7G3+N1-7G3+N1-7G3+)的特征。体外生物物理研究发现,G-四链体能够形成平行结构[3]、反平行结构[4]、(3+1)型杂合结构[5]等多种不同的拓扑结构(图 1)。G-四链体不但具有独特的结构特征而且有着丰富的生物学功能[6]。在人体基因组大约含有376000个可以形成G-四链体的序列[7],它们位于基因组许多重要的生物学功能区域,如一些重要的原癌基因的启动子区,包括c-myc[8]、VEGF[9]、K-ras[10]、Bcl-2[11]、c-kit[12]、PDGF[13]基因以及其他与人类某些疾病有密切关系的序列中。G-四链体在调控这些基因的转录、复制和重组以及调节端粒的稳定性方面具有重要作用[14]。基于G-四链体结构在人类基因组中的重要功能,近年来人们一直致力于开发设计快速、简单、具有高选择性的G-四链体识别探针。目前,各种结构特异性的G-四链体荧光探针已经被报道,广泛应用于体外溶液中对G-四链体的结构和性质的研究。
虽然体外溶液环境的证据都证明G-四链体结构具有良好的稳定性,但如何实现活体G-四链体的检测仍存在很大挑战。我们对人类基因组中大多数能够形成G-四链体的序列的结构和功能的认识仍然很有限,该领域的研究仍然处在初始阶段[15]。体内G-四链体的识别和检测存在3个关键问题:(1)G-四链体靶点是结构特异性并非序列特异性的,使得传统的核酸检测方法无法使用,需要使用具有结构特异性的检测手段;(2)G-四链体并非单独存在,而是嵌在基因组DNA的双螺旋二级结构之间,因此该检测方法必须仅能识别G-四链体结构而不响应双螺旋结构;(3)G-四链体序列在整个基因组中的含量甚微,几乎被淹没在基因组DNA双螺旋结构的“海洋”中。这些因素导致活体细胞中G-四链体的检测非常困难,因此,设计开发具有高选择性和高灵敏度的G-四链体识别探针对研究G-四链体在人类基因组中的分布、含量和功能具有重要意义[16]。
目前,对G-四链体的识别策略,绝大部分集中于生物大分子主体-有机小分子配体相互作用的策略,即:筛选或合成能特异性结合G-四链体的有机荧光小分子配体,当小分子独立存在时和小分子配体结合于G-四链体上时,产生较大的荧光增强或猝灭的信号差异,从而使G-四链体结构被检测到。另外一类是利用生物学技术合成或筛选能够与G-四链体特异性结合的抗体,通过免疫荧光分子来检测G-四链体结构。这两大类G-四链体识别探针已经在体外溶液环境中进行了深入研究,并取得了很好的研究结果。但当将这小分子配体应用到活体细胞中时,会导致细胞死亡,因为它们取代了端粒上的保护蛋白成分[17]。因此,如何实现体内活细胞中G-四链体的检测仍然是一个很大挑战。本文对一些常见的G-四链体识别探针进行了综述,同时也介绍了这些探针在染色体和细胞水平对G-四链体的检测。最后,我们展望了G-四链体的检测在肿瘤早期检测和治疗中的重要意义。
近十年来,人们对人工合成的能形成G-四链体的核酸序列在体外溶液中形成的G-四链体结构进行了广泛研究。大量具有良好选择性和亲和力的G-四链体识别探针陆续被发现和报道。这些小分子荧光探针具有以下特征:(1)具有平面芳环共轭结构,使其能够与G-四链体通过末端π-π堆积的方式进行特异性识别;(2)较高的荧光量子产率。这些探针本身固有的荧光很弱,而当与G-四链体结构结合之后,它们的光谱性质发生明显变化,吸收光谱红移,荧光量子产率显著提高。这一类探针被称为“light-up”型探针[18],它们对G-四链体特异性识别主要是基于末端平面π-π堆积的方式,G-四链体的平面结构是区别于双链DAN和单链DNA、RNA的主要结构特征,因此这些具有平面芳环共轭结构的小分子特异性地识别区分G-四链体结构和其他的核酸二级结构(如单链DNA、双链DNA、单链RNA等)。另外,静电引力、氢键等也有一定作用。这类荧光探针已被广泛应用在各种不同的分析环境,如溶液体系、凝胶体系、染色体水平和固定的细胞水平中,甚至这种高灵敏度的小分子荧光探针有望用于活体细胞中G-四链体的标记检测。
这些探针根据其对G-四链体结构的识别,大致可以分为3类:非选择性识别G-四链体结构的探针;识别平行及混合型G-四链体结构的探针;识别反平行G-四链体结构的探针。这些探针所表现出的对不同G-四链体结构的识别差异,使得研究者一方面可以将其用于区分不同G-四链体结构类型;另一方面可以将其用于特定G-四链体结构的识别及分析。另外,通过对这些探针分子的结构及功能分析,也可以为特定G-四链体结构识别探针的设计提供思路。
大多数基于结构特异性的识别探针能够很好地区分G-四链体结构和其他DNA二级结构,并且人们一直在尝试提高探针的选择性和灵敏度。最初研究发现,乙啶及其衍生物(图式1)可用作体外凝胶电泳时G-四链体的荧光探针[19],用以反映G-四链体的含量,但是其灵敏度和选择性均不够高。后来,Chang 等[20]发现并报道了具有超高灵敏度、检测限可达到10 nmol/L G-四链体的咔唑类衍生物(BMVC)(图式1),作为一个有机单分子其检测G-四链体的灵敏度获得了大幅提高,但是选择性仍不尽如人意。
于是,为了同时兼顾灵敏度和选择性,近年来逐步发现一些将多种功能组合在一起的分子。这种设计思路往往是将一种荧光基团作为信号单元(singal unit)引入到能够选择性识别G-四链体结构的配体骨架分子(结合单元,binding unit)中(图式1)。
Monchaud 课题组[21]将具有较好亲和力和选择性的吡唑并双甲酰胺(PDC)与具有较高荧光量子产率的噻唑橙(TO)结合,以同时提高对G-四链体检测的选择性和灵敏度。两者结合产生了两种连接化合物(图式1):通过一段柔性链连接两部分的PDC-L-TO和通过合并使用N-甲基喹啉部分将两者的骨架连接起来所形成一段刚性连接的PDC-M-TO,结果显示,这两种分子都具有荧光开关的特性,但在选择性方面却存在一定差异。类似的组合型分子还有将TO与Isaindigotone 骨架分子形成的化合物ISTO[22]、TO与benzofuroquinolinium 骨架分子相连[23]、香豆素与Isaindigotone 骨架分子形成化合物ISCH-1[24]、Nagasawa 课题组设计的BODIPY荧光标记的端粒抑素类似物[25]等。这些组合型单分子荧光探针能够很好地区分G-四链体结构和ssDNA、dsDNA等,部分分子可以作为可视化比色分析和荧光光谱分析双结果输出探针。
早期的这些基于结构特异性的小分子荧光探针能很好地选择性区分G-四链体DNA和双链DNA,但很少能识别G-四链体的不同拓扑结构。为了实现检测G-四链体不同的拓扑结构,笔者课题组[26]采用花菁染料(图式2)的超分子聚集体构建荧光分子探针,实现了在溶液体系、凝胶体系和界面体系中识别并标记具有特殊结构的G-四链体DNA。结果发现,只有(3+1)杂合型和平行结构的G-四链体样品能够显著增强MTC单体的荧光强度,而其他结构的DNA样品则不行。当与特定结构的G-四链体结合之后,ETC单体的荧光强度增加1000倍,可以用来作为识别这些特定结构G-四链体的特征指标。
方酸染料是一种在红色到近红外区具有很强吸收和发射光谱的染料,Jin等[27]合成了一种二氰亚甲基功能化的方酸分子CSTS(图式2)。这种方酸分子在溶液中以H-聚集体的形式存在,仅能与平行结构的G-四链体发生较强的相互作用,从而由H-聚集体转化成单体形式,其吸收光谱发生显著变化。CSTS以其选择性高、荧光信号背景低、摩尔吸光系数大、荧光量子产率高的优点将成为一种优良的平行结构的G-四链体识别探针用于体外和体内生物样品的检测。
此外,上官棣华等[28]在二苯并咪唑衍生物的基础上,将咔唑基与二苯咪唑衍生物的骨架结合设计合成了新型小分子BPBC(图式2)。这种小分子具有一个比G4平面稍大的V-型π共轭平面结构,这种结构使得BPBC能够对平行结构的G-四链体具有良好的选择性,其荧光强度增加330~1800倍;而当反平行的G-四链体存在时,只增加了30~110倍;其他的单链和双链DNA只增加30倍。这表明BPBC能很好地识别平行结构的G-四链体。
同时,Nikan等[29]合成了一种能够选择性识别平行结构G-四链体的荧光开关探针——乙炔基桥连的6,8—嘌呤二聚物(APD)(图式2)。APD分子能够与平行结构的G-四链体以末端堆积的形式结合,使其荧光量子产率明显提高,而不能与杂合型或反平行结构的G-四链体相互作用,因而可以作为一种优良的平行结构G-四链体的识别探针。
为了在大量的双链DNA中选择性地识别很少量的G-四链体结构,Chang等[20]合成小分子BMVC(图式1),该分子能够很好识别人类端粒序列中的单分子G-四链体结构。 BMVC在与G-四链体结构结合之后其荧光量子产率明显增强,这种利用荧光强度变化的性质只可以用来识别人类端粒中的G-四链体结构,但不能区分G-四链体的拓扑结构的差异。已经有文献报道,人类端粒DNA中含有2种不同结构的G-四链体——平行G-四链体和反平行G-四链体[30]。由于BMVC在与不同拓扑结构的G-四链体作用时具有相似的荧光光谱,因此不能用来识别不同结构的G-四链体。但荧光寿命会因为环境的影响而不同,因此他们[31]利用BMVC与不同结构的G-四链体作用时荧光寿命的不同来识别反平行结构的G-四链体。他们利用双光子激发荧光寿命成像显微镜(2PE-FLIM)技术来测量BMVC与不同结构的G-四链体作用时的荧光寿命。该方法可以确认人类端粒DNA中反平行G-四链体的存在,而且可以定位它在有丝分裂中期染色体上的位置。
与这种单分子荧光探针不同,笔者课题组盖伟等[32]利用超分子聚集体在不同环境中聚集和解聚的性质,在花菁染料ETC的基础上设计了一种新的菁染料分子DMSB。这种分子在溶液中以单体的形式存在,但保持着聚集成聚集体的潜能,当与特定结构的G-四链体作用之后会聚集成J-聚集体。BMSB分子形态的变化可以通过CD光谱明显地反映出来,因此可以作为识别椅型反平行结构G-四链体的一种高特异性、高灵敏度的识别探针。
上述小分子荧光探针具有特异性识别G-四链体结构、检测灵敏度高以及可视化检测等优点而被广泛应用于体外溶液中G-四链体结构的识别检测。但大多数的荧光分子探针仅在体外具有较高的检测活性,而在活体细胞中则失去检测活性。因此如何实现活体细胞中G-四链体结构的检测有待进一步更深入的研究。
全基因组生物信息学分析表明,在人类基因组中普遍存在G-四链体序列的模体,而且在基因的调控区域、基因主体和重复序列(例如端粒)中都富含G-四链体结构[33]。在人体染色体中,端粒的长度大约15 kbp,其3末端是一段由(TTAGGG)n串联重复序列形成的G-悬垂末端[34]。大量实验已经表明,端粒DNA结构在体外能够形成稳定的G-四链体结构。相对于特定基因内G-四链体,端粒G-四链体含量更高,分布也更为集中。因而,早期研究就实现了染色体内端粒G-四链体的检测。直到近年,Balasubramanian课题组才在染色体内标记到了基因组G-四链体。
设计合成新型的能够用于体内检测G-四链体结构的小分子化合物是目前研究的重点。Chang等 [20b]于2004年设计了BMVC,该分子具有如下优点:在DNA存在时其荧光强度会显著增强;相较双链DNA,BMVC对(TTAGGG)4序列形成的四链体结构具有更高的选择性和结合能力;对于四链体(TTAGGG)4,BMVC荧光发射峰在575nm 附近,而对于双链DNA荧光发射峰在545nm 左右。这些独特的性质使BMVC具有被应用于体内端粒G-四链体检测的潜能。他们用BMVC标记有丝分裂中期的染色体,发现当2nmol/L 的BMVC与从人体细胞中提取的染色体DNA进行混合孵育时,能够在575nm处检测到荧光发射峰,证明了人类细胞核中G-四链体结构的存在。进一步比较有丝分裂中期染色体末端和染色体其他区域的荧光信号,结果显示四链体结合BMVC的荧光信号出现在临近端粒的区域(图 2)。这些实验结果充分证明了在人体端粒中存在G-四链体结构。
此外,Boussin等[35]为了证明G-四链体结构在体外的存在,设计了一种能够与染色体结合的氚标记的G-四链体配体3H-360A。他们在体外证明了该分子对G-四链体结构具有良好的选择性,并进行了人体基因组DNA与3H-360A 的结合性实验,结果表明,3H-360A主要选择性地结合端粒的3悬垂末端的G-四链体结构。他们将3H-360A与有丝分裂中期的染色体相互作用,通过放射自显影技术发现3H-360A优先结合的是人体正常细胞和肿瘤细胞的染色体末端区域。这些结果证明,特异性的G-四链体配体能够与染色体末端区域相互作用,证明了G-四链体配体可以诱导或稳定人类细胞端粒中的G-四链体结构。
一些单链的抗体蛋白,如hf2、Gp1锌指蛋白,能够与G-四链体结构特异性地识别结合,因此成为新一类的G-四链体分子探针。Balasubramanian课题组[36] 利用噬菌体在单链克隆抗体中筛选出一种能够特异性识别G-四链体结构的抗体BG4。ELISA实验表明,该抗体只对分子内和分子间的DNA G-四链体具有较强的亲和性,而不结合发夹型的RNA、单链DNA或者双链DNA。他们用BG4与人类细胞有丝分裂中期的染色体共同孵育,研究了G-四链体结构在单个染色体水平的分布。结果显示在人类端粒中存在G-四链体结构(图 3ⅳ-ⅴ),同时在端粒之外的染色体主体区域也存在G-四链体结构(图 3ⅰ-ⅲ)。更有意思的是,他们发现姐妹染色单体的对称位置上被着色,证明了在新复制的DNA中相同的基因组位点会形成G-四链体结构。
研究已经证明,人类基因组DNA在体外环境中可以形成多种稳定的G-四链体结构,以G-四链体特异性的抗体探针检测染色体上的G-四链体结构证明了在染色体末端的端粒区域和端粒之外的很多区域都能形成G-四链体结构。但是,如何直接证明体内细胞中也存在G-四链体构象仍是一个很大的挑战。
Balasubramanian课题组[36] 将筛选出的BG4 G-四链体特异性抗体与固定的人类细胞共同孵育,实现了对人类细胞中DNA G-四链体的可视化、定量检测。将BG4与固定的U2OS肿瘤细胞孵育后,进行免疫荧光成像分析,结果显示细胞核出现均匀的BG4着色点。为了进一步证明BG4的G-四链体特异性,他们进行对比实验:将BG4与预折叠好的G-四链体DNA 预孵育之后,U2OS细胞中的BG4着色点消失(图 4b);而如果将BG4与单链DNA预先孵育,U2OS细胞中的BG4着色点就不会消失;向BG4细胞中转染预折叠好的G-四链体,细胞中的着色点会明显增加(图 4d),而当转染单链DNA时则不会增加;对细胞用DNA酶处理之后,着色点会明显减少(图 4c),而用RNA酶处理之后则不会减少。这些对比实验充分证明了BG4抗体可以实现人类细胞中DNA G-四链体结构的可视化检测。
采用G-四链体特异性的单克隆抗体来检测细胞中的G-四链体结构,必须先固定细胞,这种操作会杀死细胞,难以确定动态环境中的四链体行为。最近,Shivalingam等[38]开发出了能够在活细胞中检测G-四链体DNA 的荧光分子ADOTA-M和DAOTA-M2(图式3)。他们在体外培养的骨癌细胞中,用显微镜实时观察了荧光分子与四链体DNA的相互作用。结果显示,这种荧光分子可以区分双螺旋DNA和四链DNA,因为它结合四链体时发光时间更长。而且利用荧光寿命呈像技术,这种探针可以用来研究体内小分子与G-四链体的相互作用。
迄今,已经开发出了大量靶向G-四链体结构的小分子配体,使得DNA G-四链体结构在体外溶液体系中的检测取得极大进展。大量荧光小分子探针的开发设计也实现了G-四链体结构的可视化、高灵敏度检测。从这些G-四链体特异性的小分子配体可以预见,未来更多不仅能区分G-四链体和双链DNA而且能够识别各种不同G-四链体拓扑结构的小分子配体也会被合成出来。这些多功能的小分子探针的开发设计为实现G-四链体结构在染色体和活体细胞水平的检测提供了工具。
G-四链体作为一种特殊的核酸结构,与双链DNA相比,在细胞中的含量很低,很难在染色体或细胞水平检测到。但目前特异性的抗体和小分子配体的结合实现的染色体和细胞水平的G-四链体的检测为进一步实现活体细胞中的检测带来了希望。在染色体水平,富含G序列可以改变多种结构,这可能与它的功能密切相关。例如,端粒酶不能延伸含有四链体的端粒,因为这种酶只能复制线性的DNA,不能将四链体结构作为识别底物。端粒序列折叠形成G4结构能够抑制肿瘤细胞中端粒酶的活性。进一步深入研究四链体的折叠和去折叠及其构象的灵活性对于理解G-四链体的生物功能和开拓药物治疗的新方向具有重要意义。另外,大量的非端粒富含G序列在人类基因组中被发现,进一步研究这些非端粒G4结构在人类基因组中的分布、含量、结构和功能具有重要意义。在细胞水平,G-四链体配体可以选择性地靶向癌细胞、诱导特殊的响应(如端粒不稳定、DNA损伤等)。实现G-四链体在细胞水平的检测将为开发新的抗肿瘤治疗方法提供思路。