本发明涉及干细胞,尤其涉及一种多能干细胞多能性的评价方法和系统。
背景技术:
1、多能干细胞(pluripotent stem cells, psc)主要以胚胎干细胞(embryonicstem cells, esc)和诱导性多能干细胞(induced pluripotent stem cells, ipsc)为代表,因其具有分化发育成为各种组织器官的能力,在再生医学、细胞治疗等领域具有重要的应用价值。在实践应用中,psc的多能性是影响多能干细胞的质量和用途的关键因素,因此,psc的多能性评价方法对于控制psc的质量和功能细胞分化具有重要意义。
2、目前常用的psc多能性的评价方法主要包括以下几种:
3、(1)畸胎瘤检测:将一定数量的人多能干细胞(hpsc)注射入免疫缺损的小鼠体内(通常注射到后肢肌肉、睾丸、腹股沟或皮下部位)。注射后4-12周,多能干细胞将生成可检测的畸胎瘤。畸胎瘤包含代表三个胚层的组织,并且可通过组织学检验定性分析,确认各胚层分化谱系细胞存在,进而定性评价psc的多能性。但是该方法检测周期长(4-12周),容易错过检测窗口期,进而影响研发生产的进度;而且该方法还存在检测成本高、实验鼠异质性对实验影响较大等问题;此外,该方法对实验条件和技术人员的要求较高,任何技术失误都可能影响检测结果的准确性。由于畸胎瘤是多谱系肿瘤,包含多种类型的细胞和组织,因此单一样本可能无法全面反映肿瘤的全貌,导致检测结果的偏差。此外,实验用小鼠的差异也可能造成实验偏差。
4、(2)三胚层分化检测:人胚胎干细胞(es)和诱导多能干细胞(ipsc)具有向三胚层(内胚层、中胚层和外胚层)分化的潜能。三胚层分化同时独立进行,由于向不同胚层的分化是在不同的培养孔中独立进行的,分化完成后通过免疫细胞化学或rt-qpcr法可检测对应胚层的基因、标志物以确定psc向三个胚层的分化能力。但是psc分化能力受到培养条件和不同的诱导因子影响,目前三个胚层诱导培养基配方以及市面上的三胚层分化试剂盒种类繁多,不同来源的样本在不同的诱导培养条件下,各个胚层的分化能力出现较大的差别,导致该方法难以标准化。
5、(3)拟胚体(embryoid bodies,eb或ebs)形成检测:eb是胚胎干细胞(es)或诱导多能干细胞(ipsc)在体外一定的培养条件下形成的一种球状结构,具有内、中、外三胚层结构,在形态学上与哺乳动物早期的胚胎发育阶段具有很高的相似度,使用免疫荧光、rt-qpcr法等手段对分化后的eb进行三胚层特定的标志物进行测定,从而评估ipsc的多能性及其向内、中、外胚层的分化能力,进而可以评价ipsc的多能性和分化潜能。但是使用免疫荧光染色、rt-qpcr法检测特定标志物的表达情况,通常仅使用少量或几个基因和标志物进行定性或半定量,以评价psc的多能性,较难全面、准确地反映不同来源psc及分化后多胚层、多谱系的分化细胞,且检测方法通量较低。
6、目前已有的psc多能性评价方法均需要多种方法联合评价表征多能性。因此目前本领域仍然存在对全面、稳定、可标准化的多能干细胞多能性评价方法的需求。
技术实现思路
1、本发明提供一种多能干细胞多能性的评价方法和系统。
2、为解决目前多能干细胞多能性的评价方法存在的问题,本发明首先对用于表征多能干细胞多能性的基因标志物进行了筛选。本发明通过bulk rna-seq方法对多个来源、多个重复的多能干细胞及其分化后的拟胚体进行转录组测序,基于对转录组数据的分析,对三胚层早期转录基因、其不同的组合及其与多能干细胞多能性的相关性进行了大量的筛选,获得了一组基因标志物,其能够更为全面、准确地反映多能干细胞的多能性;通过主成分分析(pca)、相关性分析验证(correlation),上述基因标志物组合在不同多能干细胞样本间的pca结果可重复性好、分辨率高、生物意义显著、主成分空间分布非常集中。部分基因通过rt-qpcr法(taqman探针法)进行验证,结果显示rt-qpcr与转录组测序结果高度相关。因此,该组基因标志物适合作为多能干细胞多能性评价的标志物。该方法具有通量高、易操作、普适性强、易于标准化等优势,能够更全面地评价多能干细胞的多能性。具体地,本发明提供以下所述的技术方案。
3、第一方面,本发明提供基因标志物组合,所述基因标志物组合包括选自四种基因标志物中的一种或多种,所述四种基因标志物为干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物;
4、其中,所述干性基因标志物包括cnmd、cxcl5、dnmt3b、dppa5、esrg、hesx1、ido1、lck、lin28a、nanog、pou5f1、sox2、tdgf1、tert、trim22、usp44和zfp42;
5、所述外胚层分化基因标志物包括cdh9、col2a1、dlk1、dmbx1、dmrt3、drd4、en1、fabp7、fgf5、gad1、hes5、lhx2、lmx1a、map2、meis1、myo3b、ncam1、nes、neurod1、nos2、nr2f1、nr2f2、olfm3、otx1、otx2、papln、pax3、pax6、pou4f1、rax、sox1、stmn4、tfap2a、tfpi、tubb3、wnt1和zbtb16;
6、所述中胚层分化基因标志物包括abca4、alox15、aplnr、bmp10、cd36、cdh5、cdx2、colec10、tnnt2、esm1、foxf1、hand1、hand2、hey1、hopx、hoxb7、hoxc8、il10、il6st、isl1、kdr、lhx1、meox1、mesp1、mesp2、mixl1、msgn1、myh6、nkx2-5、odam、osr1、pdgfra、plvap、pparg、rgs4、snai2、tagln、tbx3、tbx6、tdo2、tm4sf1和twist1;
7、所述内胚层分化基因标志物包括afp、alb、cabp7、cdh1、cdh2、cdh20、cer1、cldn1、cplx2、cxcr4、eomes、foxa1、foxa2、foxp2、gata4、gata5、gata6、grem2、gsc、hhex、ngs2、hnf1a、hnf1b、hnf4a、klf5、lefty2、muc2、nodal、parp6、pou3f3、prdm1、rxrg、serhl2、smad2、smad3、snai1、sox17、sox7、sox9、sst、vil1和wnt3。
8、上述基因标志物组合中涉及的基因均以其常规命名显示,均可通过公开数据库查询获得其序列等信息。
9、本发明中,所述基因标志物组合按照干性、外胚层分化潜能、中胚层分化潜能和内胚层分化潜能四个维度进行分类,在各维度均提供了转录水平与多能干细胞的多能性高度相关的基因组合,利用这些基因组合能够通过有限数量的基因表征干细胞在干性、外胚层分化、中胚层分化和内胚层分化各维度的分化潜能。
10、基于多能干细胞多能性的评价需要,可选择干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物中的任意一种、两种、三种或四种的组合从干性、外胚层分化潜能、中胚层分化潜能和内胚层分化潜能中的一个或几个维度评价多能干细胞的多能性。
11、为全面评价多能干细胞的多能性,所述基因标志物组合包括干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物。
12、第二方面,本发明提供以上所述的基因标志物组合或用于检测所述基因标志物组合的表达水平的试剂在多能干细胞的多能性评价中的应用。
13、优选地,所述表达水平为转录水平。上述应用中,用于检测所述基因标志物组合的转录水平的试剂包括针对所述基因标志物组合的引物等试剂。
14、以上所述的应用包括检测所述基因标志物组合中基因的转录水平的步骤。
15、以上所述的应用还包括根据所述基因标志物组合中基因的转录水平或转录水平处理后的数据评价多能干细胞多能性的步骤。
16、第三方面,本发明提供一种多能干细胞多能性的评价方法,所述方法为以所述基因标志物组合作为标志物进行多能干细胞的多能性评价。
17、基于以上所述的基因标志物组合,本发明提供了多能干细胞多能性的评价方法,该方法通过对待评价多能干细胞样本及其分化获得的eb样本的上述基因标志物组合中各基因的转录水平进行检测,将转录水平数据fpkm进行中心化和标准化处理,最后基于干性、外胚层分化潜能、中胚层分化潜能和内胚层分化潜能这四个维度,分别将各维度的基因标志物的标准化数据取算数平均值,以此定量反映多能干细胞的干性、外胚层分化潜能、中胚层分化潜能和内胚层分化潜能。与已有多能性评价方法相比,该方法具有周期短、检测成本低,检测手段简单易行,通量高,重复性好,普适性强,易于标准化,评价结果更加全面、准确等优势。
18、具体地,所述评价方法包括以下所述的步骤。
19、将待评价多能干细胞样本分为两组,其中一组分化6~10天后得到拟胚体,作为分化样本,另一组不做处理,作为未分化样本;
20、获得分化样本和未分化样本的所述基因标志物组合的转录水平数据fpkm;
21、将所有待分析的分化样本和未分化样本分别按照基因标志物组合中的每个基因为一组进行转录水平数据中心化;所述中心化为计算各样本的n值,n值的计算公式如下:n=log2(fpkm+1);
22、将所有待分析的分化样本和未分化样本的n值分别按照所述基因标志物组合中的每个基因为一组进行z-score标准化;所述z-score的计算公式如下:z-score=(n-μ)/s;其中,μ:按照每个基因为一组,所有待分析的分化样本和未分化样本的n值的算数平均值,s:按照每个基因为一组,以所有待分析的分化样本和未分化样本的n值的标准差;
23、对于各待分析的分化样本和未分化样本,将基因标志物组合中的干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物各作为一组,分组计算各组内每个样本对应的基因标志物组合的z-score的算数平均值,即得多能性评分。
24、优选地,根据所有待分析的未分化样本的干性基因标志物的多能性评分的大小,以及所有待分析的分化样本的外胚层分化基因标志物、中胚层分化基因标志物和/或内胚层分化基因标志物的多能性评分的大小,判断待评价多能干细胞的多能性;
25、其中,未分化样本的干性基因标志物的多能性评分越高,分化样本的外胚层分化基因标志物、中胚层分化基因标志物、内胚层分化基因标志物的多能性评分越高,则待评价多能干细胞的多能性越强,分化潜能越高。
26、上述方法中,根据所有待分析的分化样本与未分化样本的多能性评分的大小,判断待评价多能干细胞的多能性;其中,未分化样本的干性基因标志物所得评分越高,则干性越强,评分高低可以量化比较不同psc样本干性强弱。分化样本的外胚层分化基因标志物评分越高,则外胚层分化能力越强,评分的高低可以量化比较各个样本间的外胚层分化能力的强弱。分化样本的中胚层分化基因标志物评分越高,则中胚层分化能力越强;分化样本的内胚层分化基因标志物评分越高,则内胚层分化能力越强。同理,分析分化样本的中胚层分化基因标志物或内胚层分化基因标志物,可以独立比较、量化任意一个胚层分化潜能的高低。
27、优选地,所述多能性评分结果可以箱线图、热图、评分表等方式表征评价。
28、上述方法中,将待评价多能干细胞分化为拟胚体可采用常规方法进行诱导分化。未分化样本即为待评价的多能干细胞样本。将待评价多能干细胞与其分化得到的eb的基因标志物组合的处理后的转录水平数据进行对比,根据分化样本与未分化样本的多能性评分的大小,判断待评价多能干细胞的多能性及分化潜能。在本发明的具体实施方式中,使用最简单的eb形成培养基诱导psc进行自分化,以减少诱导因子对eb分化潜能的影响。
29、上述方法中,在z-score计算过程中,μ和s是基于所有分化样本和未分化样本的集合计算得到的,即μ和s是针对所有分化样本和未分化样本的总和的算数平均值和标准差。
30、为评估所述多能干细胞多能性的评价方法的可靠性,本发明分别使用基因表达归一化热图、样本-样本相关性热图以及主成分分析方法对所述多能干细胞多能性的评价方法的可靠性进行检验。
31、其中,基因表达归一化热图的评估方法如下:分别使用候选基因组合列表中各组基因,中心化、标准化后的每个样本对应的每个基因的评分为数据,在基因水平进行无监督的层次聚类。
32、样本-样本相关性热图的评估方法如下:分别使用候选基因组合列表中各组基因,在样本水平进行无监督的层次聚类,其中距离定义为 (1-r^2 ), 其中 r 是对应组内基因的 log_2 (fpkm+1) 的相关系数。
33、主成分分析方法(principal component analysis, pca)是一种使用最广泛的数据降维算法。该方法通过正交变换将n维可能存在相关性的变量特征转换为k维线性不相关的变量特征,转换后的k维全新的正交特征即称为主成分。pca分析的主要原理是将高维数据投影到较低维空间,在尽可能保留数据的差异的前提下,降低数据的维度,高效地找出数据中的主要部分,将原有的复杂数据降维处理。
34、针对待评价的多能干细胞,上述的层次聚类、相关性分析、主成分分析能够评估重复样本的一致性,不同样本间的差异性,揭示样本之间的关系。
35、上述方法中,所述转录水平数据fpkm通过bulk rna-seq得到。利用bulk rna-seq获得基因标志物组合中各基因的转录水平数据具有检测通量高、基因量大的优势,能够同时基因标志物组合中所有基因的转录水平数据,避免了qpcr等检测手段仅以少数几个代表基因表征多能性导致全面性差、普适性差、检测通量低、重复性低的问题。
36、基于bulk rna-seq获得的转录组数据,使用bulk rna-seq进行转录组水平检测,对测序数据进行质控过滤、参考基因组比对、数据标准化,得到各基因的转录水平数据fpkm。
37、第四方面,本发明提供一种多能干细胞多能性的评价系统,所述系统包括:
38、(1)数据获取模块,用于获取分化样本和未分化样本的所述基因标志物组合的转录水平数据fpkm;
39、其中,所述基因标志物组合如上述第一方面中所述;
40、所述分化样本和所述未分化样本为:将待评价多能干细胞样本分为两组,其中一组分化6~10天后得到拟胚体,作为分化样本,另一组不做处理,作为未分化样本;
41、(2)评价模块,用于将数据获取模块获取的分化样本和未分化样本的基因标志物组合的转录水平数据fpkm转换为多能性评分;
42、所述多能性评分的获得包括如下步骤:
43、将所有待分析的分化样本和未分化样本分别按照基因标志物组合中的每个基因为一组进行转录水平数据中心化;所述中心化为计算各样本的n值,n值的计算公式如下:n=log2(fpkm+1);
44、将所有待分析的分化样本和未分化样本的n值分别按照所述基因标志物组合中的每个基因为一组进行z-score标准化;所述z-score的计算公式如下:z-score=(n-μ)/s;其中,μ:按照每个基因为一组,所有待分析的分化样本和未分化样本的n值的算数平均值,s:按照每个基因为一组,以所有待分析的分化样本和未分化样本的n值的标准差;
45、对于各待分析的分化样本和未分化样本,将基因标志物组合中的干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物各作为一组,分组计算各组内每个样本对应的基因标志物组合的z-score的算数平均值,即得多能性评分;
46、(3)评价结果输出模块,用于获取所述评价模块得到的多能性评分并输出评价结果。
47、以上所述的系统中,所述评价结果输出模块输出评价结果的依据为:
48、根据所有待分析的未分化样本的干性基因标志物的多能性评分的大小,以及所有待分析的分化样本的外胚层分化基因标志物、中胚层分化基因标志物和/或内胚层分化基因标志物的多能性评分的大小,判断待评价多能干细胞的多能性;
49、其中,未分化样本的干性基因标志物的多能性评分越高,分化样本的外胚层分化基因标志物、中胚层分化基因标志物、内胚层分化基因标志物的多能性评分越高,则待评价多能干细胞的多能性越强,分化潜能越高。
50、第五方面,本发明提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器用于存储程序,所述处理器执行所述程序时实现以上所述的多能干细胞多能性的评价方法。
51、第六方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有程序,所述程序被执行时实现以上所述的多能干细胞多能性的评价方法。
52、第七方面,本发明提供以上所述的系统或所述计算机设备或所述计算机可读存储介质在多能干细胞的多能性评价中的应用。
53、本发明的有益效果至少包括:本发明提供的基因标志物组合能够更为全面、准确、客观地反映多能干细胞的多能性,通过主成分分析(pca)验证,基因标志物组合在不同多能干细胞样本间的pca结果相关性好、可重复性高、分辨率高、生物意义显著、主成分空间分布非常集中,并且在未分化的多能干细胞中具有低背景。基于所述基因标志物组合,本发明提供了多能干细胞的多能性评价方法,该方法通过对所述基因标志物组合的转录水平数据进行中心化和标准化处理,获得干性、外胚层分化潜能、中胚层分化潜能和内胚层分化潜能不同维度的多能性打分,利用多种干性基因和三胚层分化早期基因对多能性进行评价,避免使用少数基因为标志物导致评价的片面性和主观判断,能够客观、准确地对多能干细胞样本的分化潜能进行评价,适用性更广;而且该方法的评价结果以量化的评分方式评价多能性及分化潜能,评价方式更加科学简单,可以为多能干细胞的克隆筛选、表征和质量控制提供有效的依据。
1.基因标志物组合,其特征在于,所述基因标志物组合至少包括选自四种基因标志物中的一种或多种,所述四种基因标志物为干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物;
2.根据权利要求1所述的基因标志物组合,其特征在于,所述基因标志物组合包括干性基因标志物、外胚层分化基因标志物、中胚层分化基因标志物和内胚层分化基因标志物。
3.权利要求1或2所述的基因标志物组合或用于检测权利要求1或2所述的基因标志物组合的表达水平的试剂在多能干细胞的多能性评价中的应用。
4.一种多能干细胞多能性的评价方法,其特征在于,所述方法为以权利要求1或2所述的基因标志物组合作为标志物进行多能干细胞的多能性评价。
5.根据权利要求4所述的多能干细胞多能性的评价方法,其特征在于,所述方法包括:
6.根据权利要求5所述的多能干细胞多能性的评价方法,其特征在于,根据所有待分析的未分化样本的干性基因标志物的多能性评分的大小,以及所有待分析的分化样本的外胚层分化基因标志物、中胚层分化基因标志物和/或内胚层分化基因标志物的多能性评分的大小,判断待评价多能干细胞的多能性;
7.根据权利要求5或6所述的多能干细胞多能性的评价方法,其特征在于,所述转录水平数据fpkm通过bulk rna-seq得到。
8.一种多能干细胞多能性的评价系统,其特征在于,所述系统包括:
9.根据权利要求8所述的多能干细胞多能性的评价系统,其特征在于,所述评价结果输出模块输出评价结果的依据为:根据所有待分析的未分化样本的干性基因标志物的多能性评分的大小,以及所有待分析的分化样本的外胚层分化基因标志物、中胚层分化基因标志物和/或内胚层分化基因标志物的多能性评分的大小,判断待评价多能干细胞的多能性;
10.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器用于存储程序,所述处理器执行所述程序时实现权利要求4~7任一项所述的多能干细胞多能性的评价方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有程序,所述程序被执行时实现权利要求4~7任一项所述的多能干细胞多能性的评价方法。
12.权利要求8或9所述的系统或权利要求10所述的计算机设备或权利要求11所述的计算机可读存储介质在多能干细胞的多能性评价中的应用。
