浅谈在发酵工艺优化中统计手段的重要性
1. 协同效应与关键因素:
优化发酵工艺实质是考察各个变量对优化目标的效应以获得各因素(变量)对目标值的影响关系,进而以此为基础确定最优操作条件。同其他 学科一样,在发酵优化时如果能建立各因素对目标的数学表达函数是最为理想的。但由于发酵中微生物性质的复杂性(微生物内部的代谢机理,调控机制等)及发酵 环境多样的传递特性(热,质量、动量),使得要建立一个准确的机理模型十分困难。因此目前常见的发酵模型多为黑箱模型,即拟合模型(虽然随着对微生物代谢 途调控机制的了解及生化反应动力学的发展,不少成功的机理模型也被建立并用于发酵的优化和调控——可参见诸多生化反应动力学教程及研究文献)。同时,更简 单的单因素试验或稍复杂的正交试验也在发酵工艺优化中得到普遍应用。虽然针对不同的优化要求,优化手段当然可以也应该尽量简单,但目前很多国内学术研究文 献还频频采用正交试验的确让人感觉很惋惜,特别是对试验数据的统计处理不够重视,相关的检验欠缺。因为在发酵时,涉及微生物性质(种类、种龄、活力,接种 量),生长条件(pH、温度),培养基组成,传递条件(溶氧量或转速、搅拌速度)等多个变量,所以不仅要考察每个因素的效应,还应考察是否存在不同因素的 协同效应。一般而言,存在如此多的因素,协同效应在所难免。而要高效判别协同效应,统计手段就不可不重视。此外,要高效的进行优化时,也应该借助统计手段 确定各个因素的效应大小,选择重要的因素进行重点考察,即抓住主要矛盾把好钢(精力)用在刀刃(关键因素)上。因此,在优化发酵工艺时,一定要有意识的应 用统计手段,首先确定关键因素(包括产生重要协同效应的因素),而后再集中精力优化关键因素。值得一提的是,要事半功倍地实现优化目标,就应该时刻牢记要 抓住主要矛盾。
2. 用统计手段建立数学模型:
前点已提及要建立数学模型,但为什么要用统计手段建立数模了?我们都知道盲人摸象的故事,其实优化发酵工艺也与此类似。试想,如 果我们能准确地定量了解各个因素是如何影响发酵目标的,那要进行优化就是个简单地求最值的问题。之所以进行单因素试验或者正交试验,目的就是通过考察输入 -输出关系建立变量-响应间的关系。我们如果仅仅通过考察几个孤立的点就想得到一个系统的全局的关系实在有盲人摸象的危险:获得一个局部的关系,得到一个 局部的极值而非全局最值;或者获得失真的关系,得到连极值都不是的结果。而如果借助统计手段,我们可以有意识的选取一些有代表性的点,以获得全局的正确关 系。比如,如果确定一个正方体的考察空间,那可以选择八个顶点+一个中心点,还可以补充考察六个面上的中心点。如此一来,不仅对全局做到了有效考察,而且 最少只用9个点就可以达到目标,胜于无目的地考察正方体的其他点。
3. 如何事半功倍确定有效因素:
如果有12个因素需要考察,那考虑到因素间的两两协同效应,则要另增加12×11=132个因素。如果采用单因素试验或正交试 验,试验将非比寻常。如果借助适当的统计手段,则可大大减少试验次数。如Plackett-Burman(拼写可能有误)试验,n次试验可以考察n-1个 因素,即进行12次试验可以考察11个因素。虽然PB有一定的缺陷,但一般而言的确是高效而又实用的。类似的非平衡或平衡块统计手段还有许多,我们可以根 据需要选择合适的手段进行试验以达到目的。
4.应用统计优化的其他好处:
在建立数学模型是,选择合适的方法也对优化过程和结果大有裨益。借助最陡 爬坡试验、中心点试验,相应面方法,均匀设计等方法能让你准确、高效的完成试验。借助SAS,SPAA,Statistics等统计手段,你可以快速完成 数据的分析、模型构建及假设检验。而且这些统计软件还特供了强大的绘图能力,你可以看到所建模型的三维图像,得到直观影响,轻松进行最优求解得到优化条 件。另外,最优算法发展比较快,象基因算法,神经元网络算法也广为应用。
以上是个人的一点浅见,谬误四溢还望大家指正,谢谢。本人原创,转贴请注明出处及作者,谢谢!http://geneevolution.space.com.cn/