结肠癌Caco-2细胞株与患者药靶蛋白表达的一致性研究

宋俞1,2,刘宇佳2,方罗2,祝幼娟2,张轶雯2,黄萍2,吴永江1*

(1.浙江大学药学院,杭州 310058;2.浙江省肿瘤医院药剂科,杭州 310022)

摘要:目的 对结肠癌细胞株与患者组织间的药物靶点蛋白表达进行一致性研究,以明确两者的相符性。方法 检索Human Protein Atlas数据库中FDA批准的药物靶点蛋白,并对兼有患者结肠癌组织和细胞株数据的蛋白进行表达评分。通过计算蛋白在细胞株与患者间表达的一致率,总体评价两者蛋白表达的相符情况,继而采用生物信息学方法进行蛋白生物学功能和信号通路注释,评价个体患者与细胞株间蛋白表达的差异性。结果 共检索得兼有细胞株(均为Caco-2细胞)和患者表达数据的药物靶点蛋白176个。患者与细胞株表达一致的蛋白比率为57.4%,与患者年龄、性别、肿瘤部位等均无相关性。两者间表达一致性较高或较低的蛋白数分别为69和82,其中47和36个蛋白表达完全一致或完全不一致。不一致蛋白在恶性肿瘤相关通路、免疫相关通路、胞外基质受体相互作用、细胞骨架与形态相关通路的富集更为显著。结论 药物靶点蛋白在Caco-2细胞株与患者结肠癌组织间的表达存在一定的差异性,提示考察细胞株与患者间靶蛋白表达的一致性具有重要意义。

关键词:结肠癌;Caco-2细胞;Human Protein Atlas数据库;药物靶点蛋白;一致性研究

肿瘤已成为严重威胁人类健康的重大疾病之一。药物治疗是恶性肿瘤尤其是中晚期恶性肿瘤患者的最主要疗法。然而,化疗药物因其毒性大,疗效有限,临床疗效仍存在瓶颈。随着肿瘤精准治疗时代的到来,分子靶向治疗药物的研究开发成为目前肿瘤治疗研究的重点。在抗肿瘤药物开发研究中,肿瘤细胞株因其具有来源稳定、重复性好、操作简单等优点,一直是抗肿瘤药物研发中最重要的体外药效学评价模型[1],但是靶向治疗药物的疗效依赖于肿瘤细胞靶点分子的特异性表达[2-3]。因此,细胞株与患者肿瘤组织分子特征的一致性决定了细胞株作为靶向药物体外研究模型的适宜性。开展细胞株与患者肿瘤组织的蛋白表达的一致性研究是评价细胞株作为体外研究模型的适宜性的,也是保证体外研究结果用于临床治疗的效果。

由于涉及大量的药物治疗靶点蛋白,目前尚无文献对体内外蛋白表达的一致性评价。2003年,在人类基因组计划的基础上,瑞典 Knut & Alice Wallenberg基金会发起了人类蛋白质图集项目,建成Human Protein Atlas 数据库(简称为HPA数据库)。至今,其可以提供人类24 000余种蛋白质在48种人类正常组织、20种肿瘤组织、47个细胞株和12种血液细胞内的分布和表达[4]。该数据库的构建与开放,为细胞株与肿瘤组织间蛋白表达的一致性评价提供了数据支持。

本研究以结肠癌作为研究对象,逐一检索HPA数据库中FDA批准的药物靶点蛋白在结肠癌细胞株与结肠癌患者组织的表达情况,进而进行一致性评价。并通过对表达一致或差异较大的蛋白分别进行功能和信号通路富集,以期评价结肠癌细胞株与患者样本间药物靶点蛋白表达的相符程度,初步提示结肠癌细胞株作为药物靶点药物临床前药效学评价模型的可靠性,为以细胞株为基础的靶向药物临床前研究结果提供一定的参考。

1 方法

1.1 数据检索与信息提取

通过HPA数据库(http://www.proteinatlas.org/ cancer)逐一检索FDA批准的药物靶点蛋白,纳入同时提供患者结肠癌组织和细胞株表达数据的蛋白,并提取患者和细胞株信息,统计靶点蛋白在患者组织样本和细胞株蛋白的表达水平。

1.2 蛋白表达水平评分

依据HPA数据库提供的蛋白免疫组化染色的强度和密度评估[5],进行总体表达水平的评价:①染色强度评分:依据免疫组化染色强度分别赋予0分(Not Detected)、1分(Low)、2分(Medium)、3分(High);②染色密度评分:依据免疫组化染色密度分别赋予0分(Negative)、1分(Weak)、2分(Moderate)、3分(Strong);③表达总分:将强度与密度得分相乘则将蛋白表达情况分为0~9分区间;④表达水平:依据总分将蛋白表达分为不表达(0分)、低表达(1~3分)、中表达(4~6分)和高表达(7~9分)。

1.3 细胞株与患者表达的一致性评价

以细胞株蛋白表达水平为基础表达,以两者处于同一表达水平为表达相符,计算每个蛋白与细胞株表达相符的患者比率,计算每个患者与细胞株表达相符的蛋白比率,并分别以0.0%~33.3%和66.7%~100.0%一致率分别定义为表达不相符蛋白和表达相符蛋白。

1.4 蛋白功能的注释与富集分析

通过DAVID在线软件(https://david.ncifcrf. gov),对患者与细胞株外表达一致或不一致的靶点蛋白依据Gene Ontology数据库进行生物学功能注释;同时,基于利用KEGG通路数据库,进一步考察其参与调控的信号通路。

1.5 数据分析

数据以width=27,height=12.85表示,采用统计学软件SPSS 20.0进行处理,数据组间差异和相关性分别以t检验和Pearson相关性分析进行校验,p<0.05表示差异有统计学意义。

2 结果

2.1 纳入蛋白、细胞株与患者的基本信息

HPA数据库中共检索到FDA批准的药物靶点蛋白502个,其中176个蛋白同时提供了结肠癌细胞株和患者的表达情况,涉及细胞株均为Caco-2细胞。每个蛋白提供了9~12位结肠癌患者组织样本的免疫组化。共涉及结肠癌患者104位,患者中位年龄为78岁(范围:11~98岁),其中51%为女性,结肠癌患者占63.4%。

2.2 患者与Caco-2细胞株的蛋白表达一致性

每位患者分别提供了1~145个蛋白表达信息。每位患者平均57.4%的蛋白与Caco-2细胞株相符。71位纳入5个及以上蛋白患者的平均相符率为53.2%(范围:12.5%~83.3%)。亚组人群分析显示,蛋白表达的相符率在不同性别患者[男性(58.6±3.5)%,女性:(56.2±2.8)%,p=0.583]或者不同肿瘤部位患者[结肠癌:(55.3±2.8)%,直肠癌:(60.6±3.7)%,p=0.256]间并无显著性差异。蛋白表达相符率与年龄(r=0.002 2,p=0.982)以及所纳入的蛋白数(r=-0.169,p=0.086 3)也均不相关。结果见图1。

width=226.8,height=192.35

图1 蛋白表达相符率与患者特征的相关性研究

Fig. 1 Correlation of concordance rate and gender, age, type of tumor or number of involvoing protein for individual

2.3 蛋白在Caco-2细胞与患者间表达的一致性

在176个靶点蛋白中,69个蛋白(39.2%)在Caco-2细胞与患者组织样本表达的一致性>66.7%,其中47个蛋白在两者间的表达数据完全一致,占总蛋白的26.7%;82个蛋白在两者间表达一致性<33.3%,占总蛋白的46.6%,其中36个蛋白(20.5%)在两者间表达完全不一致,具体见表1和图2。

2.4 蛋白的功能研究

功能富集研究结果显示,表达不相符蛋白的功能主要集中于蛋白、辅酶、辅因子、大分子的代谢过程,维生素、氮化合物、核苷酸、脱氧核糖核苷酸、核碱基和核苷酸的生物合成过程,泛素-蛋白连接酶活性,蛋白修饰与蛋白泛素化等。基于相符蛋白的功能富集细胞增殖、细胞死亡、内稳态、多细胞生物过程的P调节、突触传递、第二信使介导的信号、组织重塑、细胞迁移、学习或记忆、细胞运动、氯运输、神经冲动传递、伤口愈合、DNA拓扑变化、阴离子转运、内稳态过程的调节。在通路富集方面,表达一致的蛋白主要富集于甾类激素生物合成、酪氨酸代谢、钙信号通路、细胞因子-细胞因子受体相互作用、神经刺激配体-受体相互作用、补体与凝血反应、NK细胞介导的细胞毒作用、持久抑郁等相关通路;而不相符的蛋白多集中于免疫相关(Toll样受体、T细胞受体、B细胞受体)、肿瘤相关(结直肠癌、肾细胞癌、胰腺癌、胶质瘤、前列腺癌、恶性黑色素瘤、小细胞肺癌、急性髓性白血病)、相关物质代谢(嘌呤、谷胱甘肽、烟酸和烟酰胺)、胞外基质受体相互作用、细胞骨架与相态相关(间隙连接、焦点黏连、肌动蛋白细胞骨架调节)、蛋白酶体、ErbB信号通路、GnRH信号通路、神经营养因子信号通路、肥厚型心肌病、病毒性心肌炎等信号通路;此外,部分肿瘤相关通路(VEGF通路、膀胱癌、慢性粒细胞白血病)同时在相符蛋白和不相符蛋白的通路富集中具有相关性。

表1 Caco-2与结肠癌患者药物靶点蛋白一致性研究

Tab. 1 The concordance rate of drug-target protein expression between Caco-2 cell line and patients with colorectal carcinoma

相符率蛋白数蛋白列表 0%36F2、PSMB8、CD86、CD4、ITGA2B、KCNC1、SLC5A2、AR、CD3E、TUBA4A、MAP2、C3、ICAM1、ABCC1、VEGFB、SLC12A2、ADK、BCR、EPHA2、FASN、NR3C1、TUBE1、RFK、POLE2、SMS、PTGS2、UGCG、PDE7A、FDPS、GSR、MAP2K1、PNP、SOAT1、PDXK、KEAP1、FN1 ~10%19CD44、TBXAS1、NNMT、SIRT5、DHFR、ABL1、CKB、HMGCR、HMMR、PSMD1、TUBA1A、RRM2B、CACNA1S、RAF1、PDGFRB、ABAT、ITGAV、GSS、SIGMAR1 ~20%15CA14、FTL、QPRT、GANAB、METAP2、PRKAB1、TYMS、PDE10A、JUN、POLB、SRC、CAT、PSMB9、PSMD2、RPL3 ~30% 8ACE、MAOA、ADRA2C、ATP2C1、CA4、NFKB1、CCND1、PLIN3 ~40%10SDHD、IFNAR2、MUT、PSMB1、BRAF、GART、ITGB1、TOP2B、PTGS1、PSMB10 ~50%11MET、GANC、TUBB、CAMLG、PLA2G4A、DNMT1、PSMB2、HPRT1、MAPK3、BCL2、LHCGR、ERBB2、POLA1 ~60% 6BLVRB、PRDX5、HDAC6、CD33、M6PR、SQLE ~70% 4HRH2、IKBKB、CPT2、HDAC2 ~80% 7ADA、CPT1A、TUBG1、PDE4C、MAP2K2、CLCN2、HDAC1 ~90% 5TOP1、CKMT2、KCNB1、LCK、RXRB ~99% 66ALAD、FCGR3A、OPRD1、COMT、APEX1、TOP2A 100%47AMY2A、ANXA1、CD247、CYP19A1、DBH、EGFR、ESR1、GRIA1、IFNGR1、KCNJ1、KIT、MS4A1、NOS3、PGR、PNLIP、SNAP25、TNFRSF8、TPO、TYR、VWF、AKR1C2、AKR1D1、CA1、CA3、CASR、DRD5、FGA、FOLH1、GABRA1、GABRG1、MAPT、OPRM1、PLA2G1B、PLG、PROC、SLC12A1、SV2A、TNFSF11、GABRA6、PLAT、RYR1、SLC22A8、ADRB1、FGF2、MS4A2、TOP1MT、VEGFA

width=480.2,height=351.45

图2 表达一致蛋白或不一致蛋白的通路富集

Fig. 2 Results of function and pathway enrichment

3 讨论

肿瘤细胞株广泛用于临床前靶向抗肿瘤研究,是目前体外研究的主要模型。细胞株与患者在生物学特征上的一致性决定其体外应用价值。然而目前尚无针对肿瘤细胞株与患者肿瘤组织蛋白表达水平的一致性分析。本研究着眼于FDA批准的药物靶点蛋白,借助HPA数据库,对靶点蛋白的临床患者与结肠癌细胞株表达水平进行一致性分析,并运用生物信息学对靶点蛋白进行归类,功能富集,进一步对其参与调控的信号通路进行考察。

通过HPA数据库检索得到502个FDA批准的药物靶点,其中176个蛋白同时具有细胞株和患者肿瘤组织的表达数据。通过对比发现,半数以上的靶点蛋白在Caco-2细胞株的表达与超过60%的结肠癌患者一致;四分之一以上的靶点蛋白在两者的表达情况完全一致。同时超过20%的靶点蛋白在体内外表达情况完全不一致。平均每位患者与Caco-2细胞株表达相符的蛋白数约占总蛋白的50%,亚组分析显示,一致率与患者的基本特征并无相关性,说明数据具有一定的代表性。上述数据虽然为Caco-2作为靶向药物的体外研究模型可行性提供了一定的依据。但也提示,在应用Caco-2细胞进行靶点药物研究前,对靶点蛋白的体内外蛋白表达一致性考察十分必要。

另一方面,虽然Caco-2细胞与患者间药物靶点蛋白表达一致率在50%左右,但是基于生物信息学分析,尤其是KEGG通路富集结果提示,两者间表达不一致蛋白主要集中于免疫相关通路、多种肿瘤相关通路、胞外基质受体相互作用相关通路[6]、细胞骨架与形态相关蛋白[7]、蛋白酶体信号通路[8]、ErbB信号通路[9]、GnRH信号通路[10]等。上述通路多为与肿瘤发生、发展、治疗极其相关的信号通路,Caco-2细胞与患者在上述通路特征上的差异极可能会影响抗肿瘤蛋白靶向药物的响应差异。

当然,受数据库数据所限,本研究也存在一定局限性。首先HPA数据库仅提供了Caco-2细胞的数据,其他结肠癌细胞株与患者的药物靶点蛋白表达、一致性仍待明确。此外,虽然药物靶点蛋白的表达情况是蛋白靶向药物发挥作用的先决条件,但是肿瘤细胞甚至肿瘤相关基质细胞的其他分子特征也均会直接影响药物的作用。因此,Caco-2细胞与患者间的差异仍需更全面的数据支持。

综上所述,本研究基于HPA数据库开展了结肠Caco-2细胞株与患者肿瘤组织药物靶点蛋白的一致性研究。结果发现,两者间蛋白表达具有一定相关性,近半数蛋白表达一致性较高;但是对蛋白功能与通路的生物信息学分析发现,表达不一致蛋白在恶性肿瘤、免疫、胞外基质、细胞骨架等与肿瘤治疗极为相关的通路的富集显著。结果提示,药物靶点蛋白在Caco-2细胞株与患者结肠癌组织间的表达存在一定的差异性,提示考察细胞株与患者间靶蛋白表达的一致性具有重要意义。

REFERENCES

[1] WU F, LIN G Z, WU J X. An overview of cancer incidence and trend in china [J]. China Cancer(中国肿瘤), 2012, 21(2): 81-85.

[2] DOPNG B, ZHU Y M. Molecular-targeted therapy for cancer [J]. Chin J Cancer(癌症), 2010, 29(3): 370-375.

[3] 蒋建利, 付之光. 抗肿瘤小分子靶向药物及靶点研究进展[J]. 转化医学电子杂志, 2016, 3(1): 5-8.

[4] ZHU Y Y, LUO Z F, CUI Y X, et al. Pilot study on biomarkers for lung cancer based on the draft of human proteome [J]. China J Bioinform(生物信息学), 2016, 14(1): 55-58.

[5] 王红喜, 蒋雪涛. Caco-2细胞在药学中的应用和研究进展[D]. 北京: 中国医药科技出版社, 2005: 50

[6] Zent R, Pozzi A. Cell-Extracellular Matrix Interactions in Cancer [M]. Springer New York Dordrecht Heidelberg London, 2010.

[7] Feng W, Zhang K, Liu Y, et al. Apocynin attenuates angiotensin II-induced vascular smooth muscle cells osteogenic switching via suppressing extracellular signal-regulated kinase 1/2 [J]. Oncotarget, 2016, 13;7(50): 83588-83600.

[8] XU Y, YU F, CUI J H, et al. Celastrol enhances the TNF-α-induced apoptosis by promoting the deubiquitination of RIP1 in colon cancer [J]. Chin J Mod Appl Pharm(中国现代应用药学), 2017, 34(1): 43-48.

[9] MIAO Q F, SHAO R G, ZHEN Y S. An overview of antibody-based cancer therapy [J]. Acta Pharm Sin(药学学报), 2012, 47(10): 1261-1268.

[10] Kim I, Ryu J M, Paik H J,et al. Fertility rates in young Korean breast cancer patients treated with gonadotropin-releasing hormone and chemotherapy [J]. J Breast Cancer, 2017, 20(1): 91-97.

(本文责编:曹粤锋)

Consistency of the drug-target proteins profile in human tumor tissues and cell lines of colorectal carcinoma Based on the human protein database

SONG Yu1,2, LIU Yujia2, FANG Luo2, ZHU Youjuan2, ZHANG Yiwen2, HUANG Ping2, WU Yongjiang1*

(1.College of Pharmaceutical Sciences, Zhejiang University, Hangzhou 310058, China; 2.Department of Pharmacy, Zhejiang Cancer Hospital, Hangzhou 310022, China)

ABSTRACT:OBJECTIVE To compare the expression level of drug-target proteins in patients’ colorectal carcinoma tissue with Caco-2 cell line from human protein database to clarify the consistency. METHODS The protein expression levels of FDA-approved target-proteins involving in both colorectal carcinoma patients and cell lines were scored base on the intension and quantity of immunohistochemical stain from the database of Human Protein Atlas. And the protein expression between individual and cell line was compared. Then the consistency profiles of total proteins between individual and cell line were evaluated. Ultimately, proteins with well or poor consistent expression were identified analyzed by Gene ontology and KEGG enrichment. RESULTS The expression levels of 176 target proteins involving in both Caco-2 cell line and colorectal carcinoma patients(n=104) were obtained and analyzed. Almost 57.4% of proteins in individual patients were consistent to cell line, which was independently from individual characteristics, such as age, gender and tumor location. About 40% and 47% of total protein, included 47 and 36 proteins with entirely consistent and inconsistent profile, were well and poor consistent expression between patients and cell line, respectively. Those inconsistent proteins were enriched in the pathways related to various types of cancer, immune, extracellular matrix receptor interactions and cytoskeleton. CONCLUSION There is a significant difference in the target protein expression between Caco-2 cell line and colorectal tissue, the results suggest that the consistency is important to investigate cell as the model in drug preclinical development.

KEY WORDS:colorectal; Caco-2 cell line; database of Human Protein Atlas; drug-target proteins; consistency

中图分类号:R966

文献标志码:A

文章编号:1007-7693(2017)09-1229-05

DOI:10.13748/j.cnki.issn1007-7693.2017.09.003

引用本文:宋俞, 刘宇佳, 方罗, 等. 结肠癌Caco-2细胞株与患者药靶蛋白表达的一致性研究[J]. 中国现代应用药学, 2017, 34(9): 1229-1233.

基金项目:浙江省自然科学基金项目(LQ17H300001;LY16H160038);浙江省医药卫生科技计划平台重点项目(2015ZDA006);浙江省中医药科技计划项目(2015ZA036);浙江省卫生创新人才培养项目;浙江省“151人才工程”第二层次培养项目

作者简介:宋俞,男,主管药师 Tel: (0571)88122114 E-mail: sydy3-330@163.com

*通信作者:吴永江,男,博士,教授,博导 Tel: (0571)88208457 E-mail: yjwu@zju.edu.cn

收稿日期:2017-04-01