植物遗传资源学报

期刊导读

全长cDNA文库构建技术在运动遗传资源利用中的

来源:植物遗传资源学报 【在线投稿】 栏目:期刊导读 时间:2020-09-28

随着我国2022年北京—张家口冬季奥林匹克运动会的申办成功,全国备战冬奥的准备正如火如荼的开展。目前我国冬奥项目在运动能力开发[1]。生物学监控[2]及运动损伤[3]等方面的研究较为广泛,其中基因对运动能力的作用更是当今研究的热点话题。随着分子生物学研究的开展,基因组文库的构建成为现代生命科学研究的一项重要手段,其中cDNA文库作为研究功能基因的手段之一,引领功能基因组学的研究[4]。cDNA文库是指以细胞或组织中全部mRNA经反转录后形成cDNA,与载体连接后转化受体菌形成的重组DNA克隆群,现已广泛应用于基因的识别和剪接变异体,以及作为全长基因克隆和大规模转录组测序的重要基础,是大规模获得基因序列信息,了解基因编码蛋白相互作用关系和开展功能基因组研究的重要途径[5-6]。时至今日,运动科学领域研究已不拘泥于生物学监控、技术动作分析、运动损伤与心理调控等方面,近年来随着基因组学、蛋白组学及代谢组学等学科的相继兴起,使得通过生物技术手段对运动员进行研究成为了当今研究的热点[7-8],标志着运动科学领域进入到了“运动分子生物学”这一新时代。以往研究表明,个体之间运动能力差异受多种因素影响,其中环境和遗传因素在个体间运动能力的差异方面起很大程度作用[9],为了更为深入的研究巅峰状态下运动员机体相关基因表达水平,cDNA文库的应用将有效解决遗传资源与环境和训练干预之间的矛盾,反映特定组织或细胞某一阶段或功能状态下所有的遗传信息,从而在转录组水平研究基因结构与功能,揭示特定生物学过程的分子机制。截至目前cDNA文库构建在其他领域应用较为广泛,但在运动科学中的研究却鲜有报道,故本文结合近年来不同cDNA文库构建方法、特点及应用价值进行综述,以期为优秀运动员的遗传资源利用提供一条新的有效途径,并为我国2022年冬奥会备战期间的运动选材及运动能力开发,开展运动基因功能研究指明方向和提供理论依据。 1 全长cDNA文库构建方法概述 自1976年首例cDNA文库问世至今,cDNA文库构建方法层出不穷,而关于全长cDNA文库构建的报道则直至18年后才由日本科学家Kato等人在研究中首次提及[10-11]。随着分子克隆技术的快速发展,构建全长cDNA文库的手段。效率与质量也发生了很大程度的改善,现根据几种具有代表性的全长cDNA文库构建方法、原理和特点进行概述,从而对其作出客观的评价与分析。 1.1 SMART法 利用SMART(Switching Mechanism At 5'end of the RNA Transcript)法构建全长cDNA文库最早于1996年由Chenchik等学者提出,后经Clonetech公司对其技术进行改进并得以推广,该技术主要原理是依据全长cDNA的合成是借助Powerscript TMRT的末端转移酶活性来实现的[12-13]。由于mRNA3’末端具有特异的polyA尾结构,反转录时利用一个Oligo(dT)与其发生特异性结合,从而引导ss–cDNA的合成,当反转录进行到mRNA5’端帽子结构时,PowerscriptTM RT活性才能达到最佳效果,能够在fi rst–strand cDNA的3’末端添加上一段寡聚核苷酸序列Oligo(dC),进而保证全长cDNA的完整性。因为用于合成cDNA第二链的引物只能结合3’端含Oligo(dC)的全长cDNA,不能与短片段cDNA结合,因而最终得到的是全长的ds–cDNA,从而保证后续全长cDNA的完整性[4,14]。而对于非全长的cDNA而言,因反转录无法延伸到mRNA5’末端,反转录便不能在其3’末端加上Oligo(dC),所以在合成第二链时引物便不能与第一链模互不结合,所以便得不到全长的cDNA,具体实验流程[4]如图1所示。 不仅如此,SMART技术优势在于实验过程中在双链cDNA引物的5’端引入Sfi I A–Sfi I B识别位点,所以只需对目的cDNA进行Sfi I单酶切,便可实现目的基因的定向克隆。与其他方法相比,该技术的独特之处在于对原始材料RNA的用量无需特殊处理,减少样品的用量,实验过程简单易行,获得全长cDNA的含量较高[14]。SMART法设计思路固然巧妙,但也不免存在一定的缺陷,例如基因内部的寡聚dC影响全长cDNA加尾效率,导致文库文库中全长cDNA的比例有所下降,使文库缺乏代表性。其次PCR具有“选择性扩增”的缺陷,不利于长片段序列的扩增,致使一些大于3 000bp的基因无法完全扩增出来,导致文库冗余性过强。 为使SMART法更加完善,许多研究者对该技术进行改进。例如Chenchik[15]在原有实验基础上,将MnCl2及BSA引入到单链cDNA合成的缓冲液中以此提高反转录的延伸效率。也有人通过减少LD–PCR扩增的循环参数,将循环参数设置在20–22 cycle从而保证全长基因在文库中所占比例,降低文库冗余程度[16]。而Wellenreuther等人通过将琼脂糖电泳分级技术与SMART法结合,提高文库中全长cDNA的比例,该方法[17]现已得到广泛应用且倍受各领域研究者们青睐。 1.2 Oligo-capping法 Oligo–capping法构建全长cDNA文库于1994年由SumioSugano实验室率先研发,其基本原理是利用一个寡聚核苷酸链替换mRNA的帽子结构以达到标记mRNA 5’端的目的,从而获得全长的cDNA[18]。具体操作主要依据完整的mRNA在5’末端含有帽子结构,而降解的mRNA则无此特点,首先通过利用细菌碱性磷酸酶处理总mRNA,从中水解不完整的mRNA5’端的磷酸基团,以防止后续反应中短缺的mRNA与寡核苷酸发生连接。之后用烟草酸焦磷酸酶除去全长mRNA5’端的帽子结构,使磷酸基团充分的暴露出来,以便通过RNA连接酶在其上面连上一个寡聚核糖核酸序列,并以此作为引发第二链合成的引物结合位点,之后才能通过PCR扩增出全长的cDNA,最后通过酶切。连接载体,从而达到构建全长cDNA文库的目的,实验过程[19]如图2所示。 为完善该实验,有人以少量总RNA作为起始材料,防止酶处理过程中大量mRNA发生降解,起到保护mRNA的作用,因此改进后的方法不仅减少了原始材料的用量,提高文库构建效率,且文库代表性方面也优于原始技术[20]。而后,为提高全长cDNA在文库中所占比例,Clepet C等[21]对该技术做了一些改进,以DNA连接酶取代RNA连接酶,以提高寡核苷酸mRNA的连接效率。 Oligo–capping法主要优势在于实验快速–简单–文库特异性高等特点,但该方法也存在着些许不足之处。首先,与其他技术相比,此方法需要大量mRNA作为原始材料,其次,反应过程涉及多种酶促反应,酶的活性直接影响文库最终质量。另外,该方法涉及PCR反应,有些基因由于自身结构的特异性无法通过PCR扩增,导致文库中某些克隆缺失。扩增比例失调。使得文库缺乏代表性,从而导致文库难以反映组织或细胞中各基因的真实表达情况。 图1 SMART法全长cDNA文库构建流程示意图Figure 1 Constructing process of full-length cDNA library with SMART method 图2 Oligo-capping法全长cDNA文库原理示意图Figure 2 Principle of full-length cDNA library with Oligo-capping method 1.3 CAP-ture法 利用CAP–ture法构建cDNA文库最早始于1995年由Edery等人,该方法是利用真核生物mRNA5’端帽子结构可与“帽子结合蛋白”(转录起始因子A–EIF–4E)相互作用的原理获得全长cDNA[22],如图3。首先,通过反转录将mRNA合成双链的cDNA–mRNA复合体,随后用RNaseA对cDNA–mRNA复合体进行酶切处理除去反转录中因反应不彻底而呈单链游离存在的mRNA,而后利用A–EIF–4E对mRNA5’端甲基化的帽子结构具有亲和作用,将含有帽子结构的完整mRNA与没有帽子结构不完整的mRNA区分开,只有结合了A–EIF–4E甲基化帽子的mRNA与其对应的才是全长的cDNA,然后根据动力学原理将A–EIF–4E上结合的m7GDP替换下来从而达到洗脱全长cDNA的目的,最后经纯化–富集[23]后才能达到构建全长cDNA文库的要求。 该方法与其他技术相比之下优势在于酶促反应较少,降低了mRNA降解风险, 此外无PCR反应,降低文库冗余性,提高文库中全长cDNA比率。但该方法因操作过程复杂,对mRNA的使用量较大,成本较高,不适用于样品量较低的实验使用。此外,试验中A–EIF–4E获取及纯化过程繁琐且只特异性的绑定甲基化的帽子结构,对非甲基化的帽子几乎无绑定能力,从而导致5’端非甲基化帽子的完整 mRNA 信息丢失;严格的意义上讲,该方法在亲和蛋白与帽子结合时,mRNA5’端会丢失10~50bp的碱基,所以并非实际上的全长cDNA文库,不利于后续分析[24]。考虑到试验中存在诸多不利因素,因此该方法目前只能作为理论上的一种研究[25],很难在全长文库构建的实践中得到应用。 图3 CAP-ture法全长cDNA文库构建实验原理Figure 3 Constructing experimental principle of full-length cDNA library with CAP-ture method 1.4 CAP–trapper法 CAP–trapper法于1996年由Carninci等人在全长cDNA的研究中首次进行报道,并以此方法成功的构建了小鼠脑细胞的cDNA文库[26]。该方法原理利用mRNA5’端和3’端最末位的核糖上都存在两个相邻的羟基结构可被高碘酸钠氧化,此结构经氧化后可与生物素结合而被标记。经生物素化的mRNA反转录得到的含有标记物的cDNA/mRNA杂合体通过RnaseI处理,去除所有非全长cDNA5’端及所有未被cDNA保护的mRNA的,经免疫磁珠吸附,并使用弱碱降解mRNA,从而获得单链全长cDNA,在末端转移酶的催化作用下,对5’端oligo(G)加尾,以此为模板合成第二链,最后定向克隆即可获得全长的cDNA文库,其实验流程如图4。 最早为提高全长cDNA文库质量,研究者们对该方法进行了不同形式的改进。首先为保证全长cDNA合成效率有人在反转录体系中引入海藻糖和山梨醇以提高反转录酶的热稳定性,保证反转录酶的活性在55℃~60℃的高温下发挥最大效率。其次,用核糖核酸单链连接法加尾,减少Oligo(G)加尾对测序和蛋白质翻译的干扰,利于全长cDNA的有效转录。但是该方法的实验技术要求较高。操作复杂流程长,加之mRNA长期暴露在含酶的反应体系中极易降解,因此实践中有所受限。 CAP–trapper技术已日趋成熟,较之其他方法相比具有一定的独到之处。由于该方法不采用PCR技术从而减少了文库的冗余性,使文库具有相对较好的代表性和较高的全长比率。但由于该方法使用过多的氧化酶,致使mRNA暴露时间长,增加了降解的风险,与此同时部分降解的RNA 5’端也被生物素标记,造成假阳性的出现。此外,实验流程繁琐复杂,各阶段反应不便于控制,所以对实验者需要有较高的操作技术[27]才能保证文库的质量。 全长cDNA文库构建方法除上述四种外还有许多,但因其操作复杂。试验周期较长。技术不够成熟等原因在此便不一一赘述。综上所述,四种cDNA文库构建方法目前研究较为深入,其中以Clonetech公司为代表的SMART技术应用最为广泛,已成为构建cDNA文库的主流趋势,但上述几种文库构建方法各有利弊,所以还需依据实验目的需求来选择合适的方法。 图4 CAP-trapper法全长cDNA文库构建技术路线图Figure 4 Constructing technique route of full-length cDNA library with CAP-trapper method 2 构建cDNA文库的关键因素 从以往研究我们不难看出,采用任何方法进行文库的构建都面临以下几个关键的问题,即:mRNA的完整性与文库的最终质量,只有保证上述几个关键的因素的要求,才可满足后续研究的使用与需要。 2.1 RNA获取及其质量评定 作为反转录的重要原料,RNA的质量直接影响文库最终效果,根据不同组织样品来源的差异,RNA提取方法并无统一标准,传统的Trizol法当前使用较为广泛,而Ambion公司的MessageAmp? Bacteria II RNA Amplifi cation Kit试剂盒不仅对提取与纯化过程进行改良,而且在反转录合成cDNA之前对mRNA进行扩增使其含量增加至1 500倍之多,现已得到广泛应用,深受研究者们好评[28]。但为保证文库构建质量,首先还需对所获取的总RNA纯度进行紫外分光光度计检测,其中OD260/OD280代表总RNA的纯度,当该指标在1.8~2.0范围内时,表明RNA的纯度较好,无蛋白质或酚及异硫氰酸等杂质污染[29]。其次,利用RNA易形成二级结构的原理,采用甲醛变性胶进行RNA电泳,以此反映RNA质量的真实情况,当电泳检测28S与18S处有两条明显条带,且二者灰度值比约为2∶1时即可以证明RNA的完整性良好[16,30]可用于后续实验使用。 2.2 文库质量的评定 已有研究表明,鉴定cDNA文库的质量需从三个方面进行:首先根据Clareke公式:Pfu/ml=噬菌斑个数×稀释倍数×103/铺板稀释噬菌体体积(μl)来计算文库滴度。只有当cDNA文库包含至少1.7×105独立克隆才可确保99%丰度的mRNA呈现在库当中,其次插入基因长度应在0.1 kb以上,确保完整cDNA的富集与完整,最后重组率[16]应达到90%以上同样作为一个评价文库质量的重要指标。 3 cDNA文库构建技术的应用 cDNA文库在基因克隆。功能鉴定,及转录组学研究方面的特殊优势,使其在生物遗传资源的研究中具有更为广泛的应用价值。 3.1 筛选功能性基因 cDNA是由mRNA反转录而来,能够较容易地克隆细胞或组织特异性表达的基因,此外,与基因组文库相比,cDNA文库无内含子序列对相关基因性状的影响,相比之下文库囊括性更为具体:包含转录信息更为广泛,因此在基因克隆和筛选方面具有很大的优势。早在1997年,McPherron等人通过构建小鼠骨骼肌cDNA文库,从中筛选出肌肉生长抑制素(myostatin,MSTN)基因,通过敲除该基因的小鼠,发现MSTN 可明显的负向调控骨骼肌的增长并引起双肌性状[28],此后的研究相继证实MSTN基因还能参与糖代谢、脂肪代谢、骨密度调控等生物学过程,从而推断该基因与运动能力存在必然的联系[32-33],而通过构建cDNA文库这项技术则为日后开发运动能力相关的基因与研究提供重要的科学依据。 3.2 提供表达序列标签(ESTs) 20世纪末Adams[20]等提出了表达序列标签(Expressed Sequence Tags,ESTs)的概念即:从cDNA文库中随机挑选单克隆,从5’末端或3’末端对所插入的片段进行单向测序,所获得的一段60~500 bp的cDNA序列信息称为ESTs[34]。每条EST均代表该组织或细胞特定发育时期和生理状态下的相关的遗传信息。近年来,随着公共数据库中ESTs信息的完善,目前90%以上已注释的基因都能在ESTs库中获得[35]。获取的ESTs可用生物信息学方法进行处理并与各公共数据库中已知序列进行比较,从而迅速准确地确定基因位置与功能。由于在构建cDNA文库时尽可能地保证了cDNA的完整性,所以一旦筛选出有价值的ESTs,就可以找到对应的克隆,获得全长cDNA并直接用于相关研究。最初阶段,有关ESTs研究方向主要集中在物理图谱的构建,新基因的发现和特异组织的表达谱的研究,时至今日,随着ESTs研究的不断深入,该技术现已广泛应用于比较基因组学,功能基因组学和疾病基因组学等新兴领域当中,为人类更为深入的研究生物体生长发育,衰老,死亡生命过程的本质[36]提供重要的科学依据。 3.3 为RNA-Seq提供基础 mRNA作为DNA与蛋白质之间信息传递的一个“桥梁”,所有表达基因的信息以及其转录水平,综合起来被称作转录组[37]。随着后基因组时代的到来,转录组学成为率先发展起来以及应用最广泛的技术,转录组研究更能够从整体水平研究基因结构与功能,揭示生物学过程的分子机制。随着高通量测序技术的兴起,RNA–Seq作为一种新的高效、快捷的研究手段正在改变着人们对这一领域的认识。RNA–Seq的应用领域十分广泛,例如:2008年Sultan[38]利用深度测序对人类细胞系mRNA剪接进行了全局性研究,鉴定出9 424个剪接位点, 从中发现4 096个全新转录本。此外,RNA–Seq不仅可以检测未知或稀有的转录本,同时还可对基因表达的差异进行研究,Marioni等[39]研究人员利用Illumina测序平台对肝脏和肾脏RNA样品进行测序,并与相同RNA样品的芯片结果比较。结果发现,在相同的错误发现率的情况下,RNA–Seq比芯片技术多检测出30%的差异表达基因,此外研究结果还表明,Illumina的测序数据具有高度的重复性,技术变化相对较小。不仅如此,利用新一代高通量测序技术产生的大量数据除了可以进行以上基因注释中常见的GO–KEGG和COG分析外,还可以进行大量的其他生物信息学分析,以及开发SNPs和SSR等[40],而作为RNA–Seq的基础,构建cDNA文库则成为转录组学研究的重要技术手段。 3.4 获得全长cDNA克隆 cDNA末端快速扩增技术(rapid amplifi cation of cDNA ends , RACE)是1988年由Frohman等人发明的一项新技术,其原理是利用cDNA部分已知序列通过PCR扩增得到完整的cDNA的一种技术手段,该技术可以根据克隆mRNA的位置分为cDNA3’末端快速扩增(3’–end amplifi cation of cDNAs 3’RACE)和cDNA5’末端快速扩增(5’–end amplifi cation of cDNAs,5’RACE)。5’RACE 技术和3’RACE技术有时也结合起来用于克隆全长mRNA[41]。随着RACE技术的日益完善,通过此项技术不仅可以从文库中得到完整的基因序列,而且还可用于制备筛选cDNA文库的探针、克隆已知片段的旁侧序列、分离调控元件或被选择性剪接特殊转录物等。近年来通过科学家们对该技术的不断完善[42],使得该方法与其他技术相结合,例如抗体技术、实时荧光定量PCR技术等等,使其在新的领域也得到发展。 4 结语 随着科技的进步cDNA文库的构建技术以日趋成熟,并在农业、生物、医学等领域已取得了一批珍贵的研究成果,但在体育领域至今仍无人问津,而通过构建cDNA文库不仅可有效保存优秀运动员遗传资源和分离全长功能基因,并可从转录水平反映运动员特定时期功能基因在个体发育、细胞分化、细胞周期调控、细胞衰老等生命现象的研究过程中所起到的重要作用,从而为运动员科学选材、制定合理训练计划、筛选运动能力相关基因及运动遗传资源的保存等方面提供可行性依据和理论指导。

上一篇:撒坝猪与楚雄彝族文化的交融及其影响 下一篇:没有了