东北制药总厂应用和推广均匀设计结硕果

东北制药总厂研究院 张承恩

返回

   摘要:本文概要介绍东北制药总厂应用和推广均匀设计的实践经验。在维生素D3光化学反应中应用均匀设计,收率由33.87%提高到64%。研制出“均匀设计与统计调优软件包”·创百万元以上的经济效益,通过部级技术鉴定。此外,简介了该软件包的应用成效及其使用均匀设计时特别应注意的若干要点。

   “均匀设计”法适用于多因素、多水平的试验设计场合,某种意义上可以说是正交设计法的更新换代产品:在军工、医药、石油、化工、轻工、冶金、环保等行业诸多领域中创建了很多可喜的成绩,这个由中国数学家方开泰和王元发明的最新试验设计方法在国民经济中发挥出重要的作用。中国数学会均匀设计分会的成立,开始了有组织的推广,在国内外即将产生无法估量的重大影响。

   一、东北制药总厂应用和推广均匀设计的概况

  东北制药总厂于1988年首次成功地在人工合成维生素D3的光化学反应中应用了均匀设计。国外文献收率为35%,试验水平为33.87%。采用均匀设计试验,其中最高的一批收率45%,利用计算机统计调优,第一次优化收率达到53%,第二次优化收率达到64%,工业设备放大收率稳定在58%,具有良好的工艺再现性。

  1990年东北制药总厂为了使数理统计方法在工业参数优化中发挥更多的作用,成立了优化技术应用研究室,将各种实用的数学方法在计算机上实现,供科研和生产应用。为此研制出“均匀设计与统计调优软件包”,用这一技术完成十几项项科研和生产课题,创百万元以上的经济效益。1993年“均匀设计与统计调优技术应用”通过国家医药管理局的技术鉴定,1994年列入全国医药行业“八五”科技推广项目。

  1994年初,在方开泰教授的指导下,进一步完善了软件的功能,并根据方教授的建议,将软件包改名为“均匀设计软件包”。目前,该软件包在全国有几十个用户在使用。

  维生素C是我厂的主导产品,是国家级的优质产品。由于市场需求,需扩大生产规模,工艺亟待优化。车间技术人员用均匀设计进行发酵工艺配方试验,考察5个因素(x),2个指标(y),选用Un表做n次试验,Un表中的X都分成n个水平。用原配方工艺产酸量为55.60、收率为63.37%Un表试验计划执行后,指标有所提高,再利用“均匀设计软件包”调整配方进行参数优化.预报产酸量可达到61.99、收率可达到69.66。试验验证优化结果为产酸量为61.08、收率为71.03,拟合良好,指标分别提高了5.487.66。该项目实施将产生巨大的经济效益。

  我厂还积极参与均匀设计学会的筹建工作,并在力所能及的情况下与有关部委、公司、企业、研究院所等单位举办了几十个“均匀设计学习班”,广泛地利用各种会议宣传均匀设计法,极受科技人员的欢迎.绝大部分人有相见恨晚之感。目前,该项工艺参数优化技术已转让给几十家大中型企业和部、省、市级科研院所,将创造出更大的社会经济效益。

  化工部沈阳化工研究院染料中心在研制某种染料时,最初用单变量循环法做了不少试验。含量在80%左右徘徊。后改用均匀设计法,选用5X,安排10个水平,做了10批试验,其中最高的一批含量达89%,用软件包进行优化,最后含量达94%。这个课题组的科研人员认为均匀设计法效率真高,做的试验次数比原来少得多,而且效果很好。染料中心的总工程师认为应该大力推广这种先进的试验设计方法,不能再用瞎子爬山的笨法子了,应该采取点强制的管理办法,要求科研人员以后做课题必须使用试验设计,把科研水平提高到一个新阶段。

  目前,我们均匀设计软件包的用户的范围逐渐扩大,有医药、石油、化工、军工、纺织、食品等,用户由最初的几扩大到几+个,推广宣传的地区也由辽吉黑扩展到京津沪和内蒙、山东、安徽、江西、湖北、四川等省市自治区。我们宣讲均匀设计法,所到之处皆受欢迎。广大科研人员对先进的试验设计方法需求迫切,由于专业所限,每个人不可能精通很多试验设计技术。有些国家级的重点研究院所的科研人员对这种先进的试验设计方法了解也不多。令人感到要提高科研水平、增强国家的综合国力,均匀设计学会应加快宣传的力度,快速度推进。政府也应该象推广正交试验设计那样在全国掀起一个高潮,让科学技术迅速地转化为生产力,为企业扭亏增盈,开发新品种,提高质量、创效益,为企业走出国门进入国际大市场提供最先进的技术。历史将证明,均匀设计法将耸立起一块丰碑。

  二、应用均匀设计时应注意的若干要点

  在实际应用中看到一些初期应用均匀设计法的论文,这类论文中有的存在某些应用不当或欠妥之处,对于读者,这样的应用实例在某种意义上来说将会形成错误的引导,易导致新用户进入误区。本文就几个常见的问题根据我们的体会做些分析说明,希望在今后的应用中,不犯类似的错误。

  (一)试验次数与自变量个数的选择

  选择试验设计的目的是能在少作试验的情况下得到最佳工艺参数。希望能少作几批试验,但不是追求最少的试验次数,因为均匀设计使用最小的试验次数时不一定能获得最佳工艺参数。选择试验次数与试验中需要考察的自变量X的个数有关。试验次数多一些,揭示的规律准确程度就高一些。试验次数与自变量个数之间如何权衡需用户进行选择,在力所能及时的情况下,以试验次数安排得多一些为佳。笔者与方开泰教授多次就此问题讨论过,认为不宜提倡选择最少的实验次数,选择的试验次数³ 自变量个数的23倍为妥。

  笔者应用"均匀设计"法原发表过的论文中曾用过6X10次试验的例子。现在看来试验次数略少了一点,建立数学模型时感觉有某种困难。化工部沈阳化工研究院用我们研制的“均匀设计软件包”作了一个5X进行10次试验的例子,效果良好,从现在的认识来看选12次试验效果可能更好。

  特别说明一点,有些刊物上发表的均匀设计使用表中因素数可安排得很多,如U5表最多可安排4XU7表最多可安排6X等,笔者认为这样使用欠妥。使用的均匀设计表应以方开泰有关书为准。选用X的个数过多,在建模时会发生困难。因为,用这种方法进行实验设计后要用多元逐步回归建立数学模型,模型引入的变量模式个数最多为试验次数减2。也就是说,安排4XU5表,倘若存在线性和非线佐关系时,一次项有4个,二次项也有4个,总共有8项,但建模时最多仅能引入三种变量模式,因此不可能准确描述复杂的过程。而有的论文在使用U3表时安排了4个自变量X,用U7表安排了6X,笔者认为这种表与方开泰教授最近出版的《均匀设计与均匀设计表》一书的附表不一致。试验次数太少,信息量也相对少,不易实现参数优化。我们在研制“均匀设计软件包”2.4版本时针对上述情况进行锁定,不让用户出现错误。

  (二)水平数与区间的选择

  水平数与区间的选择以能够实施为首要原则,水平数选得多些,区间选得大些,容易描述复杂的规律。提示规律和运用规律是进行试验设计的出发点和归宿。

  规律是客观存在的,但有时它是体会得到,但摸不着看不见。规律隐含在数据中,如何从数据中把规律提取出来,对科研人员来讲这是个非常有用的实际问题。下面通过一个大家熟悉的例子来说明,区间选得不同,提示出来的规律也不同,区间选得足够大时,才能看到规律的全貌。在一个不太大的范围内,规律一般可描述正相关或负相关,可用回归直线描述,线性关系为Y=B0+B1X。当然也有可能是二次曲线,YB0+B1X +B2X·X。当B20.则是开口向上的二次曲线,B20是开口向下的曲线。再复杂一些,象滴定曲线,则属于三次曲线,在某一点出现突变。在一般憎况下,在一个区间内有正相关、负相关,又有开口向上和开口向下的曲线,如此复杂的机会一般不会大多,如果这样复杂的规律都能描述和提示出来,那么对于揭示普通的规律就更不成问题了。

  正弦曲线Ysinx,x0360度之间的规律如下:060Ysinx)近似为正相关;60120Ysinx)为开口向下的二次曲线;120240Ysinx)为负相关;240300Y=sinx)为开口向上的二次曲线;300360Ysinx)为正相关。

  在一个区间内,点选得多,则描述这个规律也越细腻和准确。线性可用3点描述。二次曲线显然用3个点就不如用5个点好。但当Ysinx),x的区间加大到0360时,用5个点描述将会是一个锯齿型,当用9个点时便可准确地描述正弦曲线的走向,预报的精度亦可达到万分之几。

  从这个实例可以看出,对于较为复杂的问题,自变量分成多个等份,则可以较好地描述出客观存在的规律,分得越细,描述得越好。反之,水平数选得太少,描述规律不可能细腻。均匀设计的特点是水平选得多,试验次数增加并不多。使用均匀设计时,选用多个水平,揭示规律较好。

  拟水平:在水平数选得较多时,有些因素可以选得多些,由于试验条件的限制,某些因素水平数不能选择大多,此时则要使用拟水平。选拟水平时的原则是宜多不宜少,选的水平数越少则均匀性越差。

  (三)建立回归模型的注意事项

  1.选变量模式时的原则是能用简单的描述就不用复杂的描述,应首先选一次项和二次项,选交互项时应能解释其物理意义。

        2.建立模型时,变量引入的F临界值高些方程的稳定性比较好。

        3.建立模型时,引入的变量个数宜适宜,不宜过多,这样可以突出主要矛盾,抓主要矛盾问题迎刃而解;引入变量过多,有时只是在表面作文章,中看不中用,使回归方程的预报能力下降。

  三、均匀设计法实施要点

  1、选择优秀的工艺路线。工艺路线良好是成功的前题,再采用先进的试验设计可以少做 试验,而迅速地实现工艺参数优化.使经济技术指标达到很高的水平。但参数组合不好,指标不高,可能导致放弃该路线,使它被束之高阁,成为憾事。但是,工艺路线即使不是处于最好水平,在这一基础进行工艺参数优化,仍可使经济技术指标有所提高,达到更上一层楼的境界,或许还能发现某些新规律。

  2、选择重要的因素,宜多不宜少。抓主要矛盾,问题可迎刃而解。在主次难分时,可利用计算机在建立数学模型时将次要因素剔除。对某些了解较多的因素,在进行试验设计时亦应引入,以便考察是否与其它因素之间还存在交互作用,可深化认识,发现新规律。

  3、选择因素的水平区间时宜宽不宜窄。水平区间选得窄,因素的变化梯度小,有些特殊的规律难以发现。区间大,可在大的范围内考察,容易发现整体规律。我们需要知道的是事物发展的全貌,而不是局部,误用局部代替全貌有时是危险的。

  4、试验次数不宜过少。我们搞试验,就是希望发现规律,并运用规律进行工艺参数优化。

  实现参数的最优组合,达到优质、高产、低耗的愿望。信息存在于数据之中,数据少,则其所携带的信息也少。搞试验设计的目的就是少安排试验,而且还要获取尽可能多的信息。试验次数过少,实现参数的最优化组合有时就有困难。在经费、时间容许的情况下多安排几批试验,还是值得的,这也是少投入多产出。

  5.数据是基础,数据的准确程度关系到试验成功之关键。

  6.建立能够描述规律的回归方程。建立数学模型时,对于选择X的变量模式,原则是能用简单的就不用复杂的。实践是检验真理的唯一标准。方程建立得好不好,要作试验来验证。

  7.使用方程预报时X的取值应在区间内,不应外延到区间外,因为在区间外无数据支持,预报精度大为下降。

返回