BP神经网络结合遗传算法优化灰树花多糖提取工艺

管鲁娟1,金伟锋1,陈茜茜2,范慧艳1,张春椿1*

(1.浙江中医药大学药学院,杭州 310053;2.浙江中医药大学附属温州市中医院,浙江 温州 325000)

摘要:目的通过BP神经网络结合遗传算法,对灰树花多糖提取工艺进行优化,以探讨最佳提取工艺。方法采用水提醇沉法,以多糖提取率为检测指标,采用3因素(提取温度、提取时间、液料比)4水平正交试验对多糖提取工艺进行考察。用BP神经网络模型结合遗传算法对试验结果进行目标寻优,并通过正交分析法进行验证,获得灰树花多糖的最佳提取工艺。结果BP神经网络结合遗传算法处理分析得到优化结果为提取温度79.6 ℃,提取时间3.4 h,液料比50∶1,此方法下多糖提取率为6.754%。结论BP神经网络结合遗传算法优化灰树花多糖提取工艺的方法有效可靠,可为同类提取工艺的优化提供新思路。

关键词:灰树花;多糖;工艺优化;BP神经网络;遗传算法

灰树花Grifola frondosa(Fr.) S.F. Gray[1]是食药两用菌之一,多孔菌科灰树花属,又叫贝叶多孔菌、千佛菌、栗子蘑等。性味甘平,无毒,具有益气健脾、补虚固本、利水消肿的功效,主治脾气两虚、体倦乏力、神疲少言、食欲下降等。灰树花多糖[2]是其主要的一类活性成分,具有明显的抗肿瘤、抗HIV病毒、免疫调节、降血糖等作用[3-4],具有广阔的医药开发前景。

BP神经网络[5]是一种按误差反向传播训练的多层前馈网络,是目前广泛应用的神经网络模型之一。遗传算法[6]是一种通过模拟自然进化过程搜索全局最优解的方法,具有原理简单、易于操作、高效、全局择优等优点。目前,BP神经网络和遗传算法也常被应用于数据的分析处理,然而BP神经网络结合遗传算法进行提取工艺寻优鲜有报道。

本实验基于单因素考察基础上,采用3因素4水平对灰树花多糖进行提取,所得结果用BP神经网络结合遗传算法进行处理分析,得到灰树花多糖的最佳提取工艺。

1 仪器与试剂

G-060S歌能超声波清洗机(深圳市歌能清洗设备有限公司);TD5A-WS台式低速离心机(湖南湘仪实验室仪器开发有限公司);JJ124BC电子天平(常熟市双杰测试仪器厂);752N紫外可见分光光度计(上海仪电分析仪器有限公司)。

葡萄糖对照品(中国药品生物制品鉴定所,批号:20141211;纯度≥98%);浓硫酸、三氯甲烷、正丁醇、苯酚、乙醇均为分析纯。

灰树花(采自浙江庆元,批号:160430)购于浙江省丽水市庆元县亿康农林科技有限公司,经浙江中医药大学张水利教授鉴定为多孔菌科灰树花属灰树花Grifola frondosa(Fr.) S.F. Gray干燥子实体。

2 方法与结果

2.1 对照品溶液的制备

取无水葡萄糖对照品适量,精密称定,加水制成每1.0 mL含0.12 mg的溶液,即得。

2.2 供试品溶液的制备

取干燥至恒重的灰树花粉末2.0 g,精密称定,置于250 mL量瓶中,加水30 mL超声提取30 min,趁热滤过,浓缩,醇沉,采用sevage法去除蛋白质共计5遍后,定容于50 mL量瓶中作为供试品溶液。

2.3 标准曲线的建立

精密量取对照品溶液0.2,0.4,0.6,0.8,1.0,1.2 mL,分别置10 mL具塞试管中,各加水至2.0 mL,迅速精密加入6%苯酚水溶液1.0 mL和浓硫酸5.0 mL,立即摇匀,放置15 min后,立即置冰浴中冷却15 min,取出,以相应的试剂为空白,用UV法,在490 nm波长处测定吸光度,以吸光度(y)为纵坐标,葡萄糖量为横坐标(x),绘制标准曲线,所得线性回归方程为:y=7.484 5x+0.041 8,r2=0.999 1,葡萄糖在0.024~0.144 mg内线性关系良好。

2.4 灰树花多糖含量测定

取“2.2”项下供试品溶液1.0 mL,按“2.3”项下方法测定多糖含量。

2.5 方法学验证

2.5.1 仪器精密度试验 精密吸取“2.1”项下葡萄糖对照品溶液1.0 mL,按“2.3”项下方法测定多糖含量,连续测定6次吸光度,计算其相对标准偏差RSD值为0.98%,符合要求,说明仪器精密度良好。

2.5.2 稳定性试验 精密吸取灰树花多糖供试品溶液,分别在制备后0,2,4,6,8,10 h后按照标准品测定方法测定总糖得率,计算其RSD值为1.16%,符合要求,说明样品溶液在10 h内稳定。

2.5.3 重复性试验 取同一批样品,平行制备6份进行提取,按“2.3”项下方法测定多糖含量,计算其RSD值为1.03%,符合要求,说明该方法重复性良好。

2.5.4 加样回收率试验 精密称取9份已知多糖含量的灰树花样品1.0 g,分别加入80%,100%,120%的葡萄糖对照品,按“2.2”项下供试品提取方式制备,按“2.3”项下方法测定多糖含量,计算其回收率为98.57%, RSD值为1.37%。

2.6 提取工艺研究

根据相关报道及前期预实验,选取提取温度(A)、提取时间(B)、液料比(C)3个因素考察灰树花多糖提取率的影响,因素与水平设计见表1。

表1 工艺优化因素及水平表

Tab. 1 Process optimization factors and levels

水平因素 A提取温度/℃B提取时间/hC液料比/倍 1502.020 2602.530 3703.040 4803.550

2.7 R语言环境下BP神经网络建模

通过3层结构的BP神经网络建立模型[7],输入节点数和输出节点数分别为3个和1个,输入节点数即提取温度、提取时间以及液料比,输出节点数即灰树花多糖提取率。将16组数据用留一法交叉验证,初始随机权(range)取0.4,参数重量衰变(decay)取5×10-4,最大迭代次数(maxit)取500,其他参数均为默认值进行训练,隐层神经元(size)的选择以训练结果的拟合误差为依据,结果见表2。

同时在相同参数的条件下,将16组数据全部作为训练样本,对隐层神经元(size)进行测试,用拟合误差作为选择依据。结果隐层神经元(size)为0,1,2,3,4,5,6,7,8时,拟合误差分别为0.829%,0.539%,0.543%,0.465%,0.195%,0.466%,0.210%,0.202%,0.044%。由表2可得,当隐层神经元(size)为0,1,2,3,4,5,6,7,8时,其平均拟合误差以及平均预测误差均<5%,表明在统计学上有显著性差异,均作为选取对象。由隐层神经元测试训练结果可得,随着隐层神经元个数的增加,其拟合误差呈现先下降后上升再下降的趋势,可判定其过度拟合[8],且神经元个数为4时出现最低值。综上所述,本实验网络隐层神经元个数取4。

表2 隐层神经元(size)训练结果

Tab. 2 Training results of hidden layer neurons (size) %

编号012345678 拟合误差预测误差拟合误差预测误差拟合误差预测误差拟合误差预测误差拟合误差预测误差拟合误差预测误差拟合误差预测误差拟合误差预测误差拟合误差预测误差 10.7441.9820.5081.1650.3504.1140.3642.8260.0923.2810.1003.5410.3782.5740.1063.3490.0913.307 20.8620.3600.5260.7340.4581.4070.4561.3830.4551.2700.2141.1030.2122.2590.0441.6420.1750.708 30.7372.1460.4931.3340.4281.2040.2130.0310.2170.1720.1871.0750.1830.4450.0690.0220.2160.079 40.8470.7820.5710.0700.4950.0520.2050.2190.1970.2930.2493.3360.1720.3660.0980.7230.1920.328 50.8380.7480.5460.7910.5191.4350.1990.3880.5251.3230.1941.4670.1161.3440.1501.1290.1560.612 60.7361.9060.4981.2310.3232.1120.1141.9000.1202.1060.0632.1990.0391.9110.1021.9150.0502.040 70.8430.8770.5610.2030.5660.2230.2960.3440.1970.1530.0730.1880.1790.4700.1811.3840.1990.138 80.8500.4710.5540.3560.4850.2200.2631.8860.2921.7310.0551.2530.1860.2240.0550.7880.2130.233 90.7192.3170.4531.3100.3481.4670.2110.2330.1421.5140.4721.2330.1900.4150.0421.2730.0291.680 100.8440.8540.5650.1550.4820.3330.2060.0930.2520.0130.2191.1380.1560.1540.1313.7530.1610.177 110.8281.4870.4851.8770.4831.8290.4761.8550.4321.5420.1331.5720.1311.4970.0341.6900.1291.547 120.8221.2390.4871.5650.4801.5740.4751.5260.4701.5280.1854.9490.2051.2260.4691.5360.0591.078 130.8041.7080.5440.6090.4510.9320.4460.9360.2171.2360.1840.8950.1871.5120.2640.3800.1981.852 140.8420.5710.5440.3640.4321.4500.5320.7500.4151.4400.2150.2270.2440.4790.0420.0730.1750.358 150.8750.1290.5370.6400.5300.6460.2130.7120.2201.8330.2152.8180.1712.3390.1271.5980.1332.380 160.8770.1540.5630.2570.4810.2960.5800.0670.4800.3170.1782.1950.1652.4300.1712.3840.0762.345 平均值0.8171.1080.5270.7910.4571.2060.3280.9470.2951.2350.1831.8240.1821.2280.1301.4770.1411.179

2.8 运用R语言编程遗传算法进行目标寻优

利用R语言编程遗传算法[9-10],采用实数编码方式,其种群大小为500,接近的最大代数为100,最大不可变代数为10,收敛公差为1×10-4,其他参数则为默认值。运用R语言进行编程,由遗传算法得到以下结果:共运行12代,运行时间为1 s,运行到第2代时可得到灰树花多糖提取率最大,预测值为6.673%,其条件为提取温度79.6 ℃,提取时间3.4 h,液料比50∶1。

2.9 验证试验

正交法优化提取工艺为80 ℃下以50∶1液料比提取3.5 h,BP神经网络结合遗传算法优化的提取工艺为79.6 ℃下以50∶1液料比提取3.4 h。按照上述2个提取工艺对灰树花多糖进行提取、过滤、浓缩、醇沉、去蛋白后,按“2.4”项下的步骤操作计算灰树花多糖提取率,平行重复3次。正交法处理条件下多糖提取率为6.528%,RSD为1.31%,BP神经网络结合遗传算法处理优化条件下多糖提取率为6.754%,RSD为1.67%,与预测结果相对误差仅为1.214%,说明BP神经网络具有良好的预测性。结果表明,BP神经网络结合遗传算法模型简单、稳定可靠,可为同类工艺优化试验提供新思路。

3 讨论

交叉验证[11]又叫循环估计,在统计学上是一种将数据样本切割成小子集的方法,主要用于建模应用。留一法则是每次只留下一个样本做测试样本,其余样本做训练样本,然后得到数个分类器和测试结果,从而获得一个更准确、可靠的模型。本实验数据较小,因此进行了16次留一交叉验证。由表2平均预测误差1.235%可知,留一验证交叉法所优化的网络模型能对灰树花多糖提取工艺参数提供准确预报性。

BP神经网络中隐层神经元个数的选择是一个重要环节[8]。隐层神经元个数是训练时出现过拟合的直接原因。随着隐层神经元个数增加,网络误差会出现迅速减小然后趋于稳定,故隐层神经元数通常取拟合误差迅速减小后的神经元个数。也有学者通过隐层神经元个数经验公式确定隐层神经元个数:隐层神经元数=width=32.25,height=15+a,aϵ[1,10]。m为输入节点数,n为输出节点数。本试验将理论知识与经验公式相结合,最后分析隐层神经元测试训练结果,综合判断隐层神经元为4,此时的网络模型能较好地避免模型过拟合出现的问题。

本实验通过BP神经网络结合遗传算法对灰树花多糖提取工艺进行优化。传统正交分析法优化条件下灰树花多糖提取率为6.528%,BP神经网络结合遗传算法处理所得结果与传统正交分析法结果相似,说明该方法稳定有效。正交试验设计是研究多因素多水平的一种常见的、普遍使用的设计方法,具有快速、高效、经济等特点。但正交分析法只能在所给水平组合中进行优化,无法在整个区域中寻求最佳组合,具有一定局限性。目前,BP神经网络和遗传算法已越来越多运用到医学、生物等领域[9-10,12-13]。BP神经网络结合遗传算法进行处理分析,不仅能在整个区域寻找最优值,还能对网络进行预测。此方法操作简单、模型稳定、可靠,所得结果更为精准,为同类提取工艺的优化提供了新思路。

REFERENCES

[1] 卯晓岚. 中国大型真菌[M]. 郑州: 河南科学技术出版社, 2000: 189.

[2] MAO R G, LIN D H, HONG X K, et al. Advances in study on active polysaccharide ofGrifola frondosa[J]. Chin Tradit Herb Drugs(中草药), 2003, 34(2): 192-195.

[3] Spelman K, Burns J, Nichols D, et al. Modulation of cytokine expression by traditional medicines: a review of herbal immunomodulators [J]. Altern Med Rev, 2006, 11(1): 128-150.

[4] GUO S Z. The manufacture technology ofGrifola frondosapolysaccharide and its function of falling blood glucose [D]. Hefei: Hefei University of Technology(合肥工业大学), 2014.

[5] ZHANG C, HAN L, YANG X M, et al. Extraction optimization for volatile oil from Schizonepetae Herba in Kushen Recipe by back propagation neural network and orthogonal design [J]. Chin Tradit Pat Med(中成药), 2015, 37(1): 70-74.

[6] LIU X, MI J Q, WU Q F. Optimization of the extraction process in berberine hydrochloride fromCoptis ChinensisFranch. by the genetic algorithm [J]. China J Tradit Chin Med Pharm(中华中医药杂志), 2013, 28(12): 3645-3648.

[7] ZHANG J X, CHENG G H, PANG T Y, et al. Application of artificial neuralnetwork and genetic algorithm to the process parameters optimization of docetaxel chitosan microspheres [J]. Chin J Mod Appl Pharm(中国现代应用药学), 2012, 29(2): 147-152.

[8] 高隽. 人工神经网络原理及仿真实例[M]. 北京: 机械工业出版社, 2003: 16-20.

[9] CHEN Q Q, JIN W F, XIONG Y K, et al. Optimization of hydroxypropyl-β-cyclodextrin of Radix Curcumae oil inclusion process by R language [J]. China J Tradit Chin Med Pharm(中华中医药杂志), 2016, 31(4): 1460-1463.

[10] YU L, ZHANG Y Y, YANG J H, et al. Study on three indicator flavonoids extraction of multi-objective optimization formula of Yangyin Tongnao Granules by R language [J]. Chin Tradit Herb Drugs(中草药), 2015, 46(8): 1156-1160.

[11] DING J, HAN M. Neural network realization based on Cross-validation [J]. J Dalian Nat Univ(大连民族大学学报), 2008, 10(5): 42-44.

[12] Selivanov V A, Benito A, Miranda A, et al. MIDcor, an R-program for deciphering mass interferences in mass spectra of metabolites enriched in stable isotopes [J]. Bmc Bioinformatics, 2017, 18(1): 88-97.

[13] WANG Y, ZHANG H N, LI S C, et al. Application of artificial neural network in evaluation of the bone marrow depression following high-dose methotrexate chemotherapy [J]. Chin J Mod Appl Pharm(中国现代应用药学), 2017, 34(6): 881-887.

(本文责编:曹粤锋)

Optimization of extraction process of polysaccharides fromGrifola frondosaby BP neural network combined with genetic algorithm

GUAN Lujuan1, JIN Weifeng1, CHEN Xixi2, FAN Huiyan1, ZHANG Chunchun1*

(1.College of Pharmacy, Zhejiang Chinese Medical University, Hangzhou 310053, China; 2.Wenzhou TCM Hospital Affiliated to Zhejiang Medical University, Wenzhou 325000, China)

ABSTRACT: OBJECTIVETo optimize the extraction process of polysaccharides fromGrifola frondosaby BP neural network combined with genetic algorithm, and obtain an optimum extraction process.METHODSUsing water extract-alcohol precipitation method, and the extraction rate of polysaccharides was used as the detection index, the extraction technology was investigated by 3 factors (extraction temperature, extraction time and liquid material ratio) 4 levels orthogonal test. BP neural network combined with genetic algorithm was used to optimize the experiment results, and the optimum extraction process of polysaccharide fromGrifola frondosawas obtained.RESULTSThrough BP neural network combined with genetic algorithm, the optimization results were as follows: the extraction temperature was 79.6 ℃, the extraction time was 3.4 h, and the liquid ratio was 50∶1, the extraction rate of polysaccharide was 6.754%.CONCLUSIONBP neural network combined with genetic algorithm to optimize the extraction process ofGrifola frondosapolysaccharide is effective and reliable, and can provide a new idea for the optimization of similar extraction process.

KEY WORDS: Grifola frondosa; polysaccharides; process optimization; BP neural network; genetic algorithm

中图分类号:R284.1

文献标志码:B

文章编号:1007-7693(2018)03-0388-04

DOI:10.13748/j.cnki.issn1007-7693.2018.03.017

引用本文:管鲁娟, 金伟锋, 陈茜茜, 等. BP神经网络结合遗传算法优化灰树花多糖提取工艺[J]. 中国现代应用药学, 2018, 35(3): 388-391.

收稿日期:2017-08-04

基金项目:浙江省教育厅科研项目(Y201534584);浙江省中医药科技计划项目(2017ZB024)

作者简介:管鲁娟,女,硕士生 Tel: 15990042478 E-mail: yunanyibei@163.com

*通信作者:张春椿,男,副教授 Tel: (0571)86613118 E-mail: zhagnchun200123@163.com