《JMP试验设计要点.pdf》由会员分享,可在线阅读,更多相关《JMP试验设计要点.pdf(54页珍藏版)》请在三一文库上搜索。
1、514180838.doc 第 1 页 共 54 页 JMP 试验设计 1. 试验设计方法及其在国内的应用 2 2. 试验设计 (DOE)就在你身边试验设计 (DOE)就在你身边 7 3. 初识试验设计 (DOE) 13 4. 多因子试验设计 (DOE)的魅力 . 18 5. 用 DOE 方法最优化质量因子配置 26 6. 顾此不失彼的 DOE . 32 7. 试验设计 (DOE)五部曲 . 39 8. 稳健参数设计的新方法 45 9. JMP 的试验设计优势 为什么用 JMP 做试验设计 50 514180838.doc 第 2 页 共 54 页 试验设计方法及其在国内的应用 随着改革开放的
2、深入, 以市场经济为代表的西方先进文明及其方法论 越来越多被国内企业界所接纳。 在质量管理、 产品(医药,化工产品, 食品,高科技产品,国防等)研发、流程改进等领域,统计方法越来 越多成为企业运营的标准配置。 试验设计作为质量管理领域相对复杂、高级的统计方法应用, 也开始 在国内被逐渐接受, 推广。其实试验设计对于我国学术界来说并不陌 生。比如均匀设计,均匀设计是中国统计学家方开泰教授(下图左 )和 中科院院士王元首创, 是处理多因素多水平试验设计的卓有成效的试 验技术,可用较少的试验次数,完成复杂的科研课题开发和研究。 国内一些大学的数学系和统计系近年来已经逐渐开始开设专门的试 验设计课程,
3、比如清华大学,电子科技大学、复旦大学等高校。国 内一些行业领先的企业,比如中石化,华为科技,中石油,宝钢等企 业,也开始在质量管理和产品研发、工艺改进等领域采用DOE 方法。 尽管 DOE 越来越多的被国内产、学、研领域所接受,但是我们还是 看到,国内对于 DOE 的研究和推广仍旧停留在比较浅的层次。以 上述企业为例,中石化下属的石化科学研究院和上海石化研究院应该 是我国石油化工研究领域的王牌单位了,不过不管是北京的石科院, 还是上海石化研究院,在油品研发、工艺改进、质量管理等领域,对 于 DOE 的使用还仅仅停留在部分因子和正交设计层面。笔者在网络 514180838.doc 第 3 页 共
4、 54 页 上查询到电子科技大学的DOE 课程目录如下: 教材目录: 第一章 正交试验基本方法 第二章 正交试验结果的统计分析方差分析法 第三章 多指标问题及正交表在试验设计中的灵活运用 第四章 Ltu(tq)型正交表的构造 第五章 2k 和3k 因子设计 第六章 优选法基础 第七章 回归分析法 第八章 正交多项式回归设计 第九章 均匀设计法 第十章 单纯形优化法 第十一章鲍威尔优化法及应用 第十二章三次设计 第十三章稳定性设计 目前业界常用的高端试验设计方法比如定制设计,筛选设计,空间填 充设计等高级试验设计方法(Advanced DOE ) ,无论在国内的统计 教学、科研还是在产业界的应用
5、,都还比较少见,但已有逐步扩大趋 势。 514180838.doc 第 4 页 共 54 页 西方企业对于 DOE 的应用早已大规模开始,比如美国航天、航空设 计的顶尖单位,乔治亚宇航设计中心,在开发导弹、战斗机等美国绝 密武器系统的时候,无一例外的使用了定制设计(Customer Design ) 。在民用领域,比如INTEL ,惠普,苹果等公司在产品研发 和质量提升阶段,都使用了高级试验设计方法。 按照试验设计 (DOE)方法发展的历程和应用的先后,我们简单介绍一 下什么是高级试验设计方法,以及和其相对应的传统试验设计方法。 如下图所示,传统DOE 包括部分因子设计、完全因子设计、响应面
6、设计、扩充设计,混料设计和田口设计。与此对应,高级DOE 则主 要包括空间填充,非线性和定制设计等。 目前能够实现 DOE(试验设计 )的专业软件工具不多, 其中最权威的当 属来自全球最大的统计软件供应商SAS 集团旗下的桌面统计分析软 件 JMP。首先, JMP 的 DOE 内容最为完整,除了包括部分因子、 完全因子、响应面设计、扩充设计,混料设计和田口设计等传统DOE 外,还包括空间填充,非线性和定制设计等高级DOE。其次, JMP 的 DOE 功能最为强大,除了整合传统的统计建模,图形展示等分析方 514180838.doc 第 5 页 共 54 页 法外,还融入了模拟, I 最佳与 D
7、 最佳比较,简单数据挖掘等独特方 法强化分析效果。再次,JMP 的 DOE 实现最为方便,因子的数量, 水平的数量, 试验的次数等等都可以自定义,用户能够根据实际问题 的要求构建试验,而无需任何修饰。更进一步,JMP 的试验设计中 还整合了模拟器 (Simulator) 功能,用户可以直接对试验所得的新方案 进行仿真模拟,以最大限度地减少失败风险。 介绍传统 DOE 的资料比较多,在此不再赘述,笔者还是将笔墨集中 在更高效的高级 DOE 上。 首先介绍一下空间填充设计(Space Filling Design) ,它适合于不存在 随机误差,但强调控制系统偏差的试验场合。众所周知,随机化 (Ra
8、ndomization) 、区组化 (Blocking) 和仿行 (Replication) 这三大理念 是我们在做常规试验设计时反复强调的基本原则,但是当对随机误差 的关注远远小于对模型本身的关注时,强调以上三条原则将不能最充 分地利用可用资源。 这时我们应当关注系统偏差, 即近似模型与真实 数学函数之差异。 空间填充设计的目标就是限制系统偏差。系统偏差 的大小与试验点的代表性密切相关,通过球填充设计、 均匀设计和最 低潜能等方法, 空间填充设计的试验方案能获得最佳的覆盖面,从而 为获得信息量最丰富的试验结果数据以提供决策支持奠定基础。 其次,再来说一说非线性设计, 它适用于需要高精度地构建
9、参数为非 线性的模型。 在某些工程技术和社会科学的试验设计领域中,常常会 514180838.doc 第 6 页 共 54 页 遇到非线性模型的研究问题, 由于非线分析的复杂性和特殊性,很多 人会采用多项式模型近似描述,简化问题。 但是当我们对模型应用的 要求较高时,上述的处理方法就显得力不从心了。其实,关于非线性 设计与建模的理论已经逐渐成熟, 通过牛顿迭代法等技术允许用户生 成非线性最优设计和最优扩充数据,从而拟合参数为非线性的模型。 与标准的多项式模型相比, 用此类模型描述相应流程时, 能够产生更 为精确的流程行为预测,也即模型与实际问题的符合性更好。 最值得一提的还是定制设计, 它灵活
10、便捷的设计风格和通用一致的分 析模式使众多对传统DOE 领域屡战屡败的人眼前一亮,信心大增。 对一般的非统计专业人士来说,单单听到响应面、混料、拉丁超立方 等一大堆专业名词就已经如坠云雾了,后面的分析报表就更如天书一 般,这样的情形不由得让人对试验设计望而却步, 试验设计用最通俗 易懂的语言还原试验设计的本质, 只要定义了你所研究产品或过程的 输入因素和输出响应、 目前的试验预算有多少, 分析的重点和目的在 哪里,定制设计生成器就会设计出最符合你要求的试验计划。再加上 实际的试验数据,具体的分析结果,如模型公式、最佳水平组合等, 就生动形象地展现在你的面前了。它突破了传统DOE“ 规则呆板,专
11、 业性强 ” 的限制,被许多欧美企业的工程师亲切地称为“ 能够量体裁衣 的 DOE” 。 我们举一个简单的例子来体会一下定制设计的独特魅力。例如,在一 次市场研究的试验设计中, 您想了解目标客户的心理偏好。其中的功 514180838.doc 第 7 页 共 54 页 能因子水平包括最差 (1)、中等(2) 和最佳 (3),而价格因子水平包括 高(1)、中(2) 和低(3)。根据排列组合的方法共可能有9次水平组合, 但实际上在这个例子中公司可能并不愿意在市场上以最低的价格出 售最佳性能的产品, 因此您需要在制订试验计划时,就排除功能中的 最佳(3)和价格中的低 (3)这一组合。这时,传统的DO
12、E(无论是全因 子设计,还是部分因子设计等)都无法实现自定义的因子水平约束, 由此生成的试验计划缺少现实意义,由此产成的分析结果缺少可信 度,而定制设计可以提供拒绝特定因子水平组合的灵活性,巧妙地解 决了这类长期困扰DOE 用户的难题。 以上方法都可以通过专业软件JMP 实现,从而进一步提高使用DOE 的工作效率,有兴趣的读者不妨一试。 试验设计 (DOE) 就在你身边试验设计(DOE) 就在你身边 DOE,即试验设计 (Design Of Experiment) ,是研究和处理多因子与 响应变量关系的一种科学方法。它通过合理地挑选试验条件, 安排试 验,并通过对试验数据的分析,从而找出总体最
13、优的改进方案。从上 个世纪 20年代费雪 (Ronald Fisher) 在农业试验中首次提出DOE 的概 念,到六西格玛管理在世界范围内的蓬勃发展,DOE 已经历了 80多 年的发展历程,在学术界和企业界均获得了崇高的声誉。 然而,由于专业统计分析的复杂性和各个行业的差异性,DOE 在很 514180838.doc 第 8 页 共 54 页 多人眼中逐渐演变为可望而不可及的空中楼阁。其实,DOE 绝不是 少数统计学家的专属工具,它很容易成为各类工程技术人员的好朋 友、好帮手。本文将以一个日常生活中的小案例为线索,结合操作便 捷的专业统计分析软件JMP,帮助大家揭开 DOE 的神秘面纱, 了解
14、 DOE 的执行过程,自由地建立属于自我的DOE 空间。 案例场景: 相信大家都吃过爆米花, 但是大家是否都了解爆米花的制作过程?在 品尝爆米花的时候, 不知道您是否注意到有很多爆米花没有爆开,也 有很多被爆焦。这两种情况都是生产过程中的质量缺陷。这里,我 们基于六西格玛软件JMP 来实现我们的目标:寻找使用微波炉加工 一包爆玉米花的更佳程序。 凭借经验,我们很容易就能确定重要因子 的合理范围:加工爆玉米花的时间 (介于 3 至 5 分钟之间)微波 炉使用的火力(介于5 至 10 档之间) 使用的玉米品牌( A 或 B) 在爆玉米花时,我们希望所有(或几乎所有)的玉米粒都爆开了,没 有(或很少
15、)玉米粒未爆开。因此玉米的 “ 爆开个数 ” 是最终关注的 重点。 第 1 步:定义响应和因子 514180838.doc 第 9 页 共 54 页 第2步:定义因子约束 根据经验,你知道:不能在试验中长时间高火力加工爆玉米花,因为 这样会烧焦某些玉米粒。不能在试验中短时间低火力加工爆玉米花, 因为这样只有少数玉米粒爆开。所以要限制试验, 以使加工时间加上 微波炉火力小于等于13,但大于等于10。 第3步:添加交互作用项 我们可以推测:与爆开玉米比例相关的任意因子效应可能取决于某些 其它因子的值。例如,品牌A 时间变化的效应可能大于或小于使用 品牌 B 相同时间变化的效应。这种因子表现出的协同
16、效应统称为二 因子交互作用。我们决定在爆玉米花加工过程的先验模型中纳入所有 可能的二因子交互作用。 514180838.doc 第 10 页 共 54 页 第 4 步:确定试验次数 根据在模型中添加的效应, 执行试验需要一定的试验次数。我们可以 使用最小值、建议值,也可以指定试验次数,只要其值大于最小值。 本例中,我们将使用默认的试验次数16。 第 5 步:制定定输出表格 生成的数据表保留了随机化的特性,显示了我们应该运行试验的顺 序,首先在 7级火力下将第一包B 牌的玉米加工3 分钟,然后在 5级 火力下将 B 牌玉米加工 5分钟,依次进行。 514180838.doc 第 11 页 共 5
17、4 页 第6步:收集和输入数据 根据设计方案加工爆玉米花。 然后, 计算每包中爆开的玉米粒的数量。 最后,保存结果至数据表。 第7步:分析结果 可以构建数据模型了,一般使用最常见的分析方法最小二乘法, 但是如果响应数据明显不呈正态分布时,选择广义线形模型法会显得 更为合适。 514180838.doc 第 12 页 共 54 页 简要地查看输出报告中的“ 参数估计 ” 表,发现所有的p 值都小于 0.05,表明所有的模型效应,包括一次主因子作用、二次主因子作用 和双因子交互作用,均是显著的。 我们已确认时间、 火力以及品牌与爆开玉米粒个数之间存在着紧密关 系,要进行进一步研究,可以打开“ 预测
18、刻画器 ” ,分析因子组合的变 化如何影响爆开玉米粒的个数。 预测刻画器显示了每个因子对响应的 预测轨迹,移动红色虚线,便能查看更改因子值对响应产生的影响。 例如,单击“ 时间” 图中的红线并左右拖动, 当“ 时间” 值从3转移至 5时, “ 爆开个数 ” 也在发生相应得变化。同时,随着时间的增加和减少,时 间和火力预测轨迹的斜率也随之改变,表明确实存在时间和火力的交 互效应。 最后,还可以通过 “ 预测刻画器 ” 寻找出最优设置,即最合意的设置。 我们根据试验分析结果而推荐的方法是:使用A 品牌,加工 5分钟, 并将火力调为 6.96级。 试验预测在此种设置下加工, 产出的玉米粒 445 个
19、以上都爆开了。 类似这种爆玉米花的案例在我们的生活和工作中还有很多很多,有 兴趣的读者完全可以将平时遇到的问题抽象成一个DOE 模型,然后 借助 JMP 这样的专业统计分析软件,轻轻松松地得到问题的解决方 案。 514180838.doc 第 13 页 共 54 页 初识试验设计 (DOE) 其实, DOE 对中国人来说,也不是一个完全崭新的内容。早在新中 国成立初期,华罗庚教授就在我国农业、工业领域大力倡导与普及 DOE,只是当时他运用的是另一个名词优选法。七十年代末, 方开泰教授和王元院士又提出了著名的“ 均匀设计 ” 法,这一方法在我 国航空航天事业中的导弹设计中取得了巨大成效。与此同时
20、,“ 均匀 设计” 法也在全球研究 DOE 理论的学术界得到了高度赞誉。 但是,在 将 DOE 的先进理念和科技方法向各行各业转移,向一般技术人员转 移,并转换为高效生产力的道路上,我们的进展还很有限。 通过“ DOE 系列之一 ” 我们已经知道: DOE 与人们的生活及工作密切 相关,在专业六西格玛统计分析软件JMP 的帮助下,掌握 DOE 也 不再是一件难事。从本质上讲,DOE 是这样一门科学:研究如何以 最有效的方式安排试验, 通过对试验结果的分析以获取最大信息。所 以,DOE 有两大技术支柱:试验规划和分析方法。其中,试验规划 又可以分为均分设计、因子设计、响应面设计等,分析方法又可以
21、分 为极差分析、方差分析、多元回归分析等。虽然DOE 的理论体系中 涉及统计分析的专业词汇很多,但为便于读者理解, 本文包括后续的 系列文章将尽量避免过多地涉及统计分析的基本概念,而是将以“ 解 决问题的思路 ” 为导向,由浅入深地向读者介绍DOE 的理论体系和应 用过程。另外, 感谢当代高速发展的计算机技术,我们可以借助六西 格玛统计分析软件JMP 来实现上述所有的试验设计方案,顺便提一 514180838.doc 第 14 页 共 54 页 下,JMP 是目前唯一能实现上述所有试验设计方案的六西格玛统计 分析软件,而且已经面向大中华地区推出中英文双语版软件。 一般的实际问题都是纷繁复杂、千
22、变万化的,但是透过现象看本质, 所有实际问题的共同点也可以通过统一的模型来抽象概括。图一就是 一个高度简化的过程模型,其中, , 是我们关心的输出变量, 例如质量指标、生产能力和成本等,通常被称为“ 响应变量 ” (Response ) ;,是我们在工作中可以加以控制的输 入变量,例如人员、设备、原材料、操作方法和环境等,通常被称为 “ 可控因子 ” (Factor ) ,它们可以是连续型数据,也可以是离散型数 据;中间的 “ 黑匣子 ” 是“ 过程” (Process ) ,在前两者之间起着衔接转 换的作用,它与不同行业、不同产品、不同技术密切相关,但整体都 可以用的数学模型来表示。这个数学
23、模型的具体表达式越精 准,说明我们对这个过程的理解越深刻,DOE 就是协助我们揭示或 验证数学模型表达式的利器! 图一 过程模型 在某些要求不高的工作环境中, 往往不需要用一个复杂的数学表达式 来描述过程的全貌, 但至少要了解哪个或哪几个因子 (X) 对响应(Y) 514180838.doc 第 15 页 共 54 页 的影响显著,哪些因子之间存在着相互影响的关系等。这时,“ 主因 子作用 ” (Main Effect )和“ 交互作用 ” (Interaction )可以帮助我们回 答这些问题。在此,不强调具体的计算过程,主要以视觉效果阐述主 要概念。主因子作用是指一个因子在不同水平下的变化
24、导致响应的平 均变化量。正如图二所示, X 在-1和+1两个水平下 Y 值的落差反映的 就是主因子作用。 交互作用是指当其他因子的水平改变时,一个因子 的主因子作用的平均变化量。 正如图三所示, 左半部分的因子 A 对 Y 的影响没有受因子B 的变化而变化,两组A 与 Y 的回归直线完全平 行,表明因子 A 与 B 之间没有任何交互作用;反之,右半部分的因 子 A 对 Y 的影响受因子 B 的变化而变化, 两组 A 与 Y 的回归直线明 显相交,表明因子A 与 B 之间存在显著的交互作用。 图二主因子作用示意图 图三交互作用示意图 514180838.doc 第 16 页 共 54 页 秉承“
25、 理论联系实际 ” 的原则,接下来我们用一个真实的案例来说明上 述原理的实际意义。 案例场景 一位工程师希望通过减小厚度来改善涡轮叶片质量,首先他想定量地 研究在相关的生产过程中, 三个最有可能会影响厚度的变量:铸造温 度(Mold Temp) 、浇注时间 (Mold Time) 和放置时间 (Set Time) 。根据 DOE 理论中最简单的 “ 完全因子设计 ” , 工程师决定开展一个 “ 三因子, 两水平,共八次 ” 的现场试验。试验方案和最终结果如表一所示,试 通过主因子作用和交互作用进行分析。 表一 涡轮叶片厚度试验记录 铸造温度 (C) 浇铸时间 (S) 放置时间 (M) 厚度(m
26、m) 300 1 1 3.61 350 1 1 3.77 300 3 1 6.75 514180838.doc 第 17 页 共 54 页 350 3 1 3.72 300 1 2 3.34 350 1 2 3.24 300 3 3 7.01 350 3 3 4.14 相关的统计计算可以借助专业六西格玛统计分析软件MP 轻松实现, 在此不一一详述,重点用形象直观的图形说明分析结果。 图四各因子的主因子作用 图五各因子间的交互作用 514180838.doc 第 18 页 共 54 页 由图四可知,铸造温度和浇铸时间对涡轮叶片的厚度有比较显著的影 响,而放置时间则几乎没有任何影响。由图五可知,铸
27、造温度与浇铸 时间之间、放置时间与浇铸时间之间的交互作用比较明显,而铸造温 度与放置时间之间的交互作用则几乎为零。通过上述可视化的分析过 程,我们清楚地理解了该过程中铸造温度和浇铸时间的正确设置对最 终产品质量的重要性。 当然以上只是有关DOE 的一个最基础的应用,笔者会在下期文章中 进一步与大家交流更深层次的内容。 多因子试验设计 (DOE) 的魅力 多因子试验设计 (DOE) 的魅力 通过前面的介绍,我们已经初步认识到了DOE 的强大分析功能。但 是有的读者可能会不以为然: 在此之前的两个案例中因子的数量太少 (只有 3个) ,而实际需要解决的问题会复杂得多,涉及的因子数量也 514180
28、838.doc 第 19 页 共 54 页 可能会很多(至少有 6个) 。因此,他就可能会得出一个结论:DOE 只适合于少数因子的问题分析,至于处理多因子问题, 则显得无能为 力了。 这个结论显然有失偏颇,其实DOE 的一大特点就是可以处理包含多 达50个(并不限于 50个)因子的复杂问题,本期的主要内容就是向 读者介绍多因子 DOE 的方法。 从理论上讲,上一期的 DOE 案例实质上采用的是完全因子设计(Full Factorial Design ) ,这类方法在因子数量较少的时候实施起来比较方 便。但是正如表一所示,当试验中的因子数量逐步增加时,试验次数 却呈指数增加, 庞大的试验规模意味
29、着巨额的试验费用,意味着实施 DOE 的可行性越来越小。 表一 完全因子 DOE 的局限 因子数量试验次数 2 4 3 8 4 16 5 32 6 64 514180838.doc 第 20 页 共 54 页 7 128 8 256 9 512 10 1024 为了解决这个矛盾, 我们可以用一种更具魅力的方法部分因子设 计(Fractional Factorial Design)来替代一般的完全因子设计。顾名 思义,部分因子设计源于完全因子设计,是与其对应的完全因子设计 中的一部分。 但究竟是哪一部分, 是否可以随机选取?举一个简单的 例子来说明。 表二显示的是一个完全因子设计的计划表,A、B
30、 和 C 表示三个主因 子,+1和-1表示因子的两个不同水平, AB、AC 和 BC 表示二阶交互 作用,ABC 表示三阶交互作用,总共需要做8次不同的水平组合来完 成1次完全因子设计的计划。 表二 3因子的完全因子设计计划表 Run A B C AB AC BC ABC 1 -1 -1 -1 1 1 1 -1 2 1 -1 -1 -1 -1 1 1 514180838.doc 第 21 页 共 54 页 3 -1 1 -1 -1 1 -1 1 4 1 1 -1 1 -1 -1 -1 5 -1 -1 1 1 -1 -1 1 6 1 -1 1 -1 1 -1 -1 7 -1 1 1 -1 -1
31、1 -1 8 1 1 1 1 1 1 1 以上这个试验计划适用于3个或以下因子,可支持 8次试验运行的 DOE。如果增加了第四个因子D,但依然只能支持 8次试验运行时, 我们应该怎么办呢?原来表二中的计划表有8行7列,任意两列间是 相互正交的。 我们希望增加一列来安排因子D,而且希望此列仍然能 与前面各列保持正交性。 数学上可以证明, “ 找出一个与前7 列不同 的列而与前 3 列保持正交 ” 是不可能的。换句话说, D 列必须与第 4、 5、6、7列中的某列完全相同。 完全相同意味着这两列的效应会被“ 混 杂” (Confounded) ,即获得计算所得的分析结果后,分不清两种效 应各是多少
32、。 权衡之下, 我们认为取 D=ABC 是最好的安排, 因为通 常主因子作用与三阶交互作用混杂的可能性最小。 根据上述决定,将 D 列取值设定与 ABC 列相同,并将其前移至第4 列,可以得到表三所列的计划表 表三4因子的部分因子设计计划表 514180838.doc 第 22 页 共 54 页 Run A B C D AB AC BC ABC(=D) 1 -1 -1 -1 -1 1 1 1 -1 2 1 -1 -1 1 -1 -1 1 1 3 -1 1 -1 1 -1 1 -1 1 4 1 1 -1 -1 1 -1 -1 -1 5 -1 -1 1 1 1 -1 -1 1 6 1 -1 1 -
33、1 -1 1 -1 -1 7 -1 1 1 -1 -1 -1 1 -1 8 1 1 1 1 1 1 1 1 聪明的读者一定会猜到还可以使用图二的计划表继续构建出第5、 第6 乃至第 7个因子,但试验的规模依然保留在 8次。当然,当同等规模的 试验中所涉及的因子数量越多时,产生“ 混杂” 的概率会越大,后期分 析结果的精确程度也会有所降低。 这就是试验成本与分析精度这对矛 盾的平衡,也是 “ 部分因子设计 ” 产生的基本原理。值得一提的是,在 制定部分因子设计的具体方案时,不必如此繁琐地逐一推算, 成熟的 六西格玛统计分析软件JMP 早已能够自动地实现了这一功能。 下面我们想通过一个发生在国外的
34、DOE 案例来体会部分因子设计的 实际意义。 514180838.doc 第 23 页 共 54 页 案例场景: ACB 公司是一家网络公司,主要为个人用户提供服务。近阶段以来 公司网站的点击数总体偏低, 排名在同行业中持续下滑, 高层管理层 决定通过一个 DOE 项目找到少数几个关键因素,提高公司网站的每 周访问量。经过初步分析, 项目团队发现关键词的个数、关键词的类 型、URL 标题、每周的更新频率、关键词在标题中的位置和免费礼 物是最具可能性的关键因子。但是如果按传统的完全因子设计的思 路,至少要做 26=64 次试验,项目的时间跨度超过一年,分析结果的 价值性大大降低,有什么好办法来克
35、服这个困难呢? 实施: 显然,这个案例用部分因子设计的DOE 来实现是再合适不过了。针 对已知的 6个关键因子,各取两个最具代表性的水平值,鉴于该项目 的主要目的是寻找关键因子,选择筛选效率最高的设计方案26-3 (=8) ,不同水平组合时分别运行1周,八周后统计相应的点击数量, 结果如表四所示。 表四DOE 实施记录 URL 标题 关键词 的个数 关键词 的类型 每周的 更新频率 关键词在 标题中的 位置 免费 礼物 点击 数 短5 旧4 第70个有5083 514180838.doc 第 24 页 共 54 页 字符 长5 旧1 第40个 字符有2272 短10 旧1 第70个 字符无20
36、12 长10 旧4 第40个 字符无4328 短5 新4 第40个 字符无6359 长5 新1 第70个 字符无3676 短10 新1 第40个 字符有4779 长10 新4 第70个 字符有6549 接着,专业六西格玛统计分析软件JMP 可以帮助我们做出具体的定 性和定量的分析, 不仅如此, 它还等借助丰富生动的图形甚至动画将 514180838.doc 第 25 页 共 54 页 分析结果展现给我们。 在此笔者不想强调过多的统计概念,只想用形 象直观的图形说明分析结果。 图一主因子作用的 Pareto 图 图二主因子作用的正态性图 无论是从图一的 Pareto 图,还是从图二的正态性图,我
37、们都能清晰 地发现每周的更新频率和关键词的类型是影响点击数的关键因子。由 此可见,在部分因子设计的思想指引下,多因子试验的时间成本、经 济成本大大减少,而主要的分析目的没有受到丝毫的影响,多因子 DOE 的魅力正吸引着更多的工作人员将DOE 的分析方法应用到更 514180838.doc 第 26 页 共 54 页 多的应用领域中。 用 DOE 方法最优化质量因子配置 经过筛选试验的精简和全因子试验的描述,很多人会满足已经取得的 成绩,但也有一些精益求精的人会提出这样的问题:现有的最佳因子 水平组合一定是所有因子设置中最理想的选择吗?如果不是,又应当 如何找出最优化的因子设置?确实,以往的DO
38、E 侧重于分析哪些因 子是重要的, 到底有多重要以及它们之间是否会相互影响,却没有刻 意去从整体中寻觅最佳的因子设置。为了解决这个问题,需要引入 DOE 中另一种新方法 (Response Surface Methodology, 即 RSM) ,这也是我们本期DOE 系列介绍的主题。在这里,笔者仍将 借助目前业界公认的高端六西格玛统计分析软件JMP 来为大家展现 响应曲面方法的实现和应用,顺便提及,JMP6是迄今业界唯一的中 英文双语版六西格玛软件,来自全球顶尖的统计学软件集团SAS。 在实际工作中,常常需要研究响应变量究竟如何依赖于自变量 X 的,进而能找到自变量的设置使得响应变量得到最佳
39、值。当自变量 的个数较少(通常不超过 4个) , 则响应曲面方法是最值得推荐的方法, 适合于要求响应变量望大(即越大越好) 、望小(即越小越好)和望 目(即越接近目标值越好)等各种常见情形。 通常来说,DOE 的核心技术可分为试验计划和数据分析两大类, 响应曲面方法也不例外。 在数据分析方面, 它和以前介绍的方法没有 什么本质的不同,但在试验计划方面,则有显著的改进。响应曲面方 514180838.doc 第 27 页 共 54 页 法的试验计划主要有中心复合设计和Box-Behnken 设计两种形式, 具体用图形说明如下。 图一三因子中心复合设计布点示意图 立方体点( Cube Point
40、) ,用蓝色点表示。各点坐标皆为1或-1, 这是全因子试验相同的部分。 中心点 (Center Point) , 用绿色点表示。各点的三维坐标皆为 0。 轴点(Axial Point) ,用黄色点表示。除了一维自变量坐标为 a (旋转性指数)外,其余维度的自变量坐标皆为0。 在三个因子 情况下,共 6个轴点。 试验计划的另一种形式就是Box-Behnken 设计。这种设计的特点是 将因子各试验点取在立方体每条边的中点上。 图二三因子布点示意图 514180838.doc 第 28 页 共 54 页 图二同样以三维空间立方体的形式展示了一个三个因子的 Box-Behnken 设计的试验计划示意图
41、。整个试验由下面两部分试验 点构成。 1. 边中心点( Side Center Point ) ,用白色点表示。除了一维自变量 坐标为 0外,其余维度的自变量坐标皆为 1。 在三个因子情况下, 共 12个边中心点。 2. 中心点 (Center Point) ,用黑色点表示。各点的三维坐标皆为0。 由以上两个示意图可以清晰地发现,响应曲面方法有规律、 有目的地 在试验计划中增添了有限次数的各因子的中心试验点和拓展试验点, 这为研究曲率的变化趋势、最优区域的确定等提供了极大的便利。 关于响应曲面方法在数据分析方面的特点,由于其和一般的因子设计 DOE 非常类似,此处就不做赘述。主要还是通过一个工
42、业案例来一 并介绍响应曲面方法的实际应用。 案例场景: 514180838.doc 第 29 页 共 54 页 如何通过催化剂 (Catalyst )和稳定剂( Stabilizer )配置比例的具体 设定,才能获得某化学试剂的最低不纯度(Impurities% )? 因子低水平(-1)高水平(+1) 催化剂%(Catalyst)0.5863.414 稳定剂%(Stabilizer)0.5863.414 显然,此时的工程师已经不满足于从仅有的四次全因子组合中选择最 优的选项,而是希望在一个更广阔的可行性空间里充分挖掘过程的潜 能,寻觅到一个最理想或是最接近理想值的配置比例。当然,实现这 一目的
43、的同时还要兼顾试验的经济成本和时间次数等。 这时候,将传统的因子设计方法搁置一旁, 适时地调用响应曲面方法, 往往会起到最佳的效果。为了提高我们应用DOE 的工作效率,本文 将直接使用专业统计软件JMP 进行响应曲面方法分析,试图获得化 学试剂的不纯度最低时的配置比例。 首先,我们根据实际情况, 以中心复合设计为原则, 迅速地确定了 13 次运行次数的试验规模以及每次试验时的因子具体设置。接着,根据 既定的试验计划进行实施, 并且及时收集每次试验的响应值。将以上 结果汇总之后,即可得到如图三所示的JMP 文件格式的数据表格。 图三中心复合设计的试验结果汇总表 514180838.doc 第 3
44、0 页 共 54 页 然后,运用“ 模型拟合 ” 的操作平台,就可以得到具体详尽的定量分析。 遵循我们 “ 强调通俗易懂,淡化统计原理” 的一贯原则,我们不多在统 计参数上花费笔墨, 依然通过形象直观的图形来说明分析结果。在求 出精确解之前 ,我们先观察一下图四所示的等高线图(Contour Plot ) 和图五所示的曲面图 (Surface Plot ) 。 从两个图中都可以清楚地看到, 在原试验范围内确实存在一个最小值。 图四等高线图 514180838.doc 第 31 页 共 54 页 图五曲面图 那么这个最小值究竟是多少?它又是在什么条件下产生的呢?进一 步借助 JMP 自带的模型预
45、测刻画器( Prediction Profiler ) ,如图六所 示,我们可以轻轻松松地得到最优化的配置比例:催化 剂%=1.410568 ,稳定剂 %=3.282724 ,这时产生的最低不纯净 514180838.doc 第 32 页 共 54 页 度%=3.156636 。顺便提及,笔者尝试了多种统计分析软件,只发现 JMP 集成了模拟功能,实在难能可贵。 至此,我们匆匆走过了应用DOE 优化流程的探索之路。 其实在 DOE 的优化过程中, 还有很多其他实用的知识和技巧,笔者将会在今后的 文章中在做深入的介绍。 图六模型的预测刻画器 顾此不失彼的DOE 本系列前四篇中已经介绍了几种不同背
46、景、不同要求的情况下, 应用 DOE 的原理和技巧。但细心的读者会发现之前的案例有一个共同的 特点(或者称为局限):数据分析仅限于单个响应变量。在实际工作 514180838.doc 第 33 页 共 54 页 中,常常会遇到要同时考虑多个响应变量的情况,例如希望断裂强度 越大越好,同时希望厚度越小越好;希望质量水平越高越好,但同时 希望成本越低越好等等。 这类问题与古人所说的有些相像:“ 鱼与熊 掌,能否兼得 ” ?确实,如何同时考虑多项指标是个很复杂的课题。 今天我们的任务就是另辟蹊径,设法解决处理多指标问题,使DOE 也可以顾此不失彼。 DOE 方法的实现离不开统计分析软件的支持, 高端
47、六西格玛统计分析软件JMP 是目前业界最先进的六西格玛工 具,其在 DOE 方面的表现最为优秀,本期案例我们仍以中英文双语 版 JMP 软件作为 DOE 方案实现的载体。 其实,解决这个问题的关键是能否创建一个新指标,用它来代表所有 的旧指标,然后通过优化这个新指标, 就可以实现多指标的平衡化最 佳,也就是总体最佳了。 这个新指标用什么来表示呢?答案是首先将 原先的响应变量转化为另一个变量:意愿(Desirability ),它的建立 可以将求任意响应变量达到最优的问题转化为求一个取值范围在0 至1之间的单个意愿达到最大的问题。 意愿的函数形式可分为三大类, 同时根据实际情况,分别确定它们的容
48、许范围,即“ 下限” (Lower) 和“ 上限” (Upper) 。当试验的指标是越大越好,即“ 望大” 型 (Maximize )时,可以用图一来描述此时意愿的规律;当试验的指 标是越小越好,即 “ 望小” 型(Minimize )时,可以用图二来描述此时 意愿的规律; 当试验的指标是越接近某值越好,即“ 望目” 型(Target) 时,可以用图三来描述此时意愿的规律。这三种不同的函数形式反映 了三种不同的指标需求,它们的共同特征是的取值越接近于 1表示 514180838.doc 第 34 页 共 54 页 越结果越令人满意,的取值越接近于 0则表示相反。 此外,一个过程可能有很多响应变
49、量,而且这些响应变量的重要程度 对我们来说也可能不尽相同。权重(Weight ) 就是用来表示不同响 应变量的重要程度的变量, 它的默认值为 1, 取值范围一般从 0.1到10, 越小说明其越不重要,越大说明其重要性越强。 在单个意愿及其对应的权重的基础上,就能够合成一个综合指标: 复合意愿。它的一般定义公式为:,如 果这些单个意愿的权重全部相等,则上式可以简化为: 。复合意愿就是我们需要创建的一个新指标,有了 它,就可以来考虑个响应变量的同时优化问题了。 图一“ 望大型 ” 意愿示意图 图二“ 望小型 ” 意愿示意图 514180838.doc 第 35 页 共 54 页 图三“ 望目型 ” 意愿示意图 在掌握了多变量响应优化的原理之后,再加上专业DOE 软件 JMP 的具体实施,相应的问题就迎刃而解了。遵循理论联系实际的风格, 本文继续通过一个工业案例来介绍多指标DOE 的实际应用。 案例场景: 在半导体行业中,蚀刻率(Etch)和不均匀性( Ununiformity )都是 非常重要的质量指标,它们的表现与生产过程中的间隙(Gap)和功 率(Power )这两个因素密切相关(具体信息参见图四)。在以往的 514180838.doc 第 36 页 共 54 页 DOE 研究中,曾分别独立地对 Etch 和 Ununiformi
链接地址:https://www.31doc.com/p-5197280.html