メニュー

実験計画法の基礎知識

実験計画法の基礎知識

著者:大阪大学 大学院 情報科学研究科 教授 森田 浩

仮説や理論が実際に当てはまっているかを検証するために、さまざまな条件の下で実験を行い、データを測定します。では、仮説を検証するためには、どのような実験をすればいいのでしょうか。また、得られたデータはどのように解析すればいいのでしょうか。これらに応えるのが、実験計画法です。本連載では8回にわたり、実験計画法の考え方や使い方を解説します。

第1回:実験計画法とは

1. 実験計画法の考え方

実験計画法とは、必要なデータを効率よく取るために計画し、適切な解析方法を与えることを目的とする統計学の応用分野です。私たちが扱うデータには、さまざまな種類があります。大別すると、データには、実態を把握するために取られたデータと、仮説を検証するために取られたデータがあります。前者の場合、全体の様子を知るために、まんべんなく多くのデータを取る必要があります。一方、後者では、実験などにより、検証に必要なデータを取ります。これらのデータが解析の目的に合致していない場合、誤解を生む結果を示すこともあります。そのため、どのようなデータを取るかは重要です。

データを解析するときに重要なのが、ばらつきの考え方です。データに誤差が含まれていると、ばらつきが生じます。データを比較するときには平均がよく用いられます。この場合、ばらつきの扱いには注意が必要です。

ここで、3つの水準でデータを取り、誤差が大きい場合と小さい場合における平均を比較してみましょう。図1の左図は誤差が大きく、3つの水準間に違いはなさそうに見えます。一方で、右図は誤差が小さく、……

>>第1回 第1章の続きを読む(PDFダウンロード)

2. 実験の計画と解析

実験計画では、効率よく適切に解析するために、特性や要因を決定します。ここで、用語の説明をしておきましょう。実験の対象となり、測定の対象となるものを特性といいます。その特性に影響を及ぼしていると考えられるものを、因子といいます。また、因子が特性にもたらす効果を、要因といいます。要因には、因子単独の効果である主効果、複数の因子間の組み合わせによる効果である交互作用、取り上げた因子で表すことのできない誤差があります。主効果や交互作用の有無は、誤差と比較して判断します。

・フィッシャーの3原則

データを取るときに、誤差を正しく見積もることが大切になります。誤差を正しく見積もるためには、気を付けるべき3つの原則があります。それがフィッシャーの3原則と呼ばれているものです(図2)。フィッシャーの3原則とは、イギリスの統計学者ロナルド・フィッシャーにより確立されました。

図2:フィッシャーの3原則(反復、無作為化、局所管理)

図2:フィッシャーの3原則(反復、無作為化、局所管理)

まず、1つ目が、反復の原則です。同一条件下の実験を繰り返すことで、誤差の大きさを見積もります。また、反復が多くなると、推定の精度も高くなります。2つ目は、……

>>第1回 第2章の続きを読む(PDFダウンロード)

3. 要因配置実験と部分配置実験

実験計画法の主なものとして要因配置実験と部分配置実験について紹介します。

・要因配置実験

要因配置実験とは、取り上げた因子の組み合わせを全て実験し、主効果と交互作用を調べるための基本的な方法です。1つの因子を取り上げた一元配置実験、2つの因子を取り上げた二元配置実験があります。さらに、局所管理の原則を適用して、より効率化を図った乱塊(らんかい)法も有効です。次回以降の連載で詳しく説明します。

・部分配置実験

部分配置実験とは、一部の組み合わせで実験する方法です。全ての交互作用を調べるのではなく、取り上げるべき交互作用を特定することで、実験回数を抑えることができます。このときに用いられるのが直交配列表です。特性に影響を及ぼすと考えられる因子が多くある場合、……

>>第1回 第3章の続きを読む(PDFダウンロード)

4. バランスの取れた実験

部分配置実験のように、限られた回数での実験を行う場合は、バランスの取れた実験をすることが重要です。物事を比較するときは、条件をそろえておく必要があります。例えば、ある焼結部品の強度を高めようとしたとき、焼結温度は何度にすればよいか、焼結時間はどれくらいにすればよいか、原材料の成分比率はどうすればよいかなど、いくつかの要因が考えられます。この場合、焼結部品の強度を高めるための最適な焼結温度を得るには、焼結温度を何通りかに設定して比較する必要があります。しかし、焼結時間や成分比率がまちまちの場合、単純に比較しても最適な焼結温度は分かりません。

焼結温度を3通り(高、中、低)、焼結時間を2通り(長、短)、原材料比率を2通り(1、2)に設定して、どのように設定するのが最適かを考えるとき、組み合わせの総数は12通りあります。全ての組み合わせで実験を行うのが要因配置実験です。

では、実験を8回しか行えないとしたら、どの組み合わせで実験すればいいでしょうか。表1の組み合わせを考えてみましょう。

表1:焼結温度、焼結時間、成分比率の組み合わせ(実験回数8回)
  焼結温度 焼結時間 成分比率
1 1
2 2
3 1
4 2
5 2
6 1
7 2
8 1

焼結温度を高にした実験は4回あります。中、低は2回しかなく、バランスが悪いように見えるかもしれません。しかし、この4回における焼結時間と成分比率を見ると、長、短が2回、1、2が2回です。2回しか実験していない中、低の焼結温度では、長、短、および1、2が1回ずつになっています。つまり、どの焼結温度でも、焼結時間と成分比率の設定は同じなので、焼結時間と成分比率の違いによる効果は焼結温度には影響しません。従って、3つの設定温度で比較することで、どの焼結温度のときに最大となるかが分かります。

もし、8番目の実験の設定温度が低であったら、高と低で焼結時間の設定回数が異なってしまいます。つまり、強度の違いは、焼結温度の高低が影響しているのか、焼結時間の長短が影響しているのか判断できないため、設定温度で比較しても、どの焼結温度のときに最大となるかは分かりません。この場合、たった1回の実験の設定を間違えるだけでも、解析ができなくなります。

では、9回の実験ができるとしたら、どんな水準で実験すればいいでしょうか。……

>>第1回 第4章の続きを読む(PDFダウンロード)

第2回:一元配置法

前回は、実験計画法の考え方を紹介しました。今回は、一元配置法を解説します。実験計画法の中で最も基本となるのが、一元配置法における分散分析の考え方です。これは、1つの因子を取り上げて、特性に及ぼす影響を調べるものです。今回は、初めに統計的推測の考え方を取り上げます。また、一元配置実験の仕組みと、最適水準における推定や予測の方法を説明します。本連載ではExcelを使用した計算例を示します。読者の皆さんは、実際に解析しながら読み進めてください。

1. 統計的推測の基礎

統計的推測とは、母集団からその一部を無作為に抽出し、それらを測定し、結果を分析することにより母集団の持つ傾向を推し測ることです。ここでは、統計的推測の基礎から説明します。

ある樹脂の粘着性には、処理温度が影響していると考えられています。130℃で加熱して試作品を5個作り、粘着力を測定したところ、次のデータが得られました。この樹脂の粘着力の母平均はいくらと推測されるでしょう。

45 41 43 40 42

まず、基本的な統計量である平均x1(数値の合計を個数で割った値)と平方和S1(個々のデータと平均との差の2乗の合計の値)、および分散V1(平方和を、データの個数-1で割った値)を求めます。これらは、データ(標本)から求めているため、標本平均、標本分散と呼ばれます。

また、樹脂の粘着力の真の平均や分散を、母平均、母分散といいます。粘着力の母平均の信頼区間(信頼率95%)は以下のように計算され、39.8から44.6となります。μは母平均、tはt分布の両側5%点、nは母集団から得たデータの数を示します。

次に、120℃で加熱した試作品の粘着力を測定しました。

43 38 38 42 40

同様の計算を行うと、平均x2=40.2、平方和S2=20.8、分散V2=5.20となり、母平均の信頼区間は37.4から43.0となります。

2通りの加熱温度を比較したとき、130℃の方が粘着力は高いといえるでしょうか。2つの信頼区間には重なりがあり、必ずしも130℃の方が高いとはいえないかもしれません。このとき、母平均に違いがあるかどうかの検定を行います。全体のばらつきを表す分散Vを求めて、検定統計量t_0を計算します。検定統計量は、サンプルデータから計算し、仮説検定(ある仮説に対して、それが正しいか否かを統計的に検証すること)で使用する統計量です。

この検定統計量は、t分布に従います。t分布には自由度とよばれるパラメータがあります。ここでは、自由度はn1+n2-2となります。検定統計量の値は両側5%点であるt(8,0.05)=2.306より小さいことから、両者に差があるとはいえません。従って、120℃と130℃では……

>>第2回 第1章の続きを読む(PDFダウンロード)

2. 一元配置実験のしくみ

1つの因子だけを変化させ、他の全てを固定して実験して特性を計測し、その因子の影響を解析することを一元配置実験といいます。処理温度に140℃を追加して、3通りの処理温度で粘着力に違いがあるかを調べます。この場合、因子が処理温度、特性が粘着力です。設定する処理温度を水準といい、ここでは3つの水準が設定されています。各水準で5個の試作品を作って粘着力を測定しました。その結果を表1に示します。このとき、140℃のときに誤って1つの試作品を壊してしまいました。

表1:3通りの処理温度における5個の試作品の粘着力
処理温度 粘着力 ni 合計 平均
A1 (120℃) 43 41 44 40 43 n1=5 T1=211 x1=42.2
A2 (130℃) 42 39 38 42 39 n2=5 T2=200 x2=40.0
A3 (140℃) 38 41 39 38 n3=4 T3=156 x3=39.0
  N=14 T=567 >x=40.5

ここでは15個の試作品を作ります。そのとき、注意しなければならないのが、無作為化の原則です。3通りの温度設定で15回実験をするので、それぞれの温度で5回ずつまとめて実験をすると効率的です。しかし、それでは無作為化ができていません。15回の実験の順序は、ランダムに決める必要があります。その場合、例えば、120℃→140℃→130℃→140℃のように、毎回温度設定を変えなければならないこともあります。ただし、仮に同じ温度を続けて実験するときでも、いったん温度をリセットして設定するのが正しいやり方なので、手間としては同じです。

2つを比べる場合、差を取ります。しかし、3つ以上を同時に比較する場合、差を考えることはできません。差を取るということは、2つの違い、すなわちばらつきを見ていることになります。そこで、3つ以上を比べるときも、それらのばらつきを考えます。ばらつきには、温度を変化させたことによるばらつきと、誤差のばらつきがあります。従って、ばらつきを2つに分解する必要があります。これを平方和によって考えます。

まず、全部のデータを用いて総平方和STを計算します。これを温度によるばらつきを表す要因平方和SAと、誤差平方和SEに分解します。水準内におけるばらつきは誤差と見なせるので、水準ごとに平方和を計算し、それらの合計が誤差平方和SEとなります。このとき、総平方和STは以下の式のように要因平方和と誤差平方和に分解されます。

実際の計算では、平方和は以下の式で簡単に求めることができます。

総平方和STは……

>>第2回 第2章の続きを読む(PDFダウンロード)

3. 最適水準における推定と予測

最適水準とは、取り上げた水準の中で最も望ましい水準をいいます。最も粘着力が高くなる処理温度での粘着力はいくつでしょうか。最初に最適水準での母平均を推測します。推測には、母平均を1つの値で示す点推定と、区間で示す区間推定があります。推定の精度を示すことができる区間推定は重要です。区間推定は、点推定値±区間幅のように表します。

まず、点推定です。点推定は、その水準における平均で与えます。この例では、120℃で最大になるので、そのときの平均42.2が点推定値です。区間推定では、信頼率という確率を指定して、その確率で含まれる区間を求めます。通常は、信頼率は95%とします。前節で説明したように、区間幅は以下の式で与えられます。

ここで用いる値は、分散分析表から分かります。誤差分散VE=2.80、誤差自由度ΦE=11、繰り返し数r=n1=5です。信頼率α=0.95の時の区間幅は、以下となります。

従って、信頼区間は42.2±1.6、すなわち40.6から43.8となります。

Excelで信頼区間を求めるには、自分で関数を入力しなければなりません。t分布の両側%点は、数値表から求められますが、Excel関数を使えば簡単に求めることができます(図2)。t(11,0.05)であれば、=T.INV.2T(0.05,11)で求められます。

図2:Excel関数による母平均

図2:Excel関数による母平均

信頼区間で求めたのは、120℃のときの粘着力の母平均の区間です。120℃で作った樹脂1つずつの粘着力の値ではありません。個々の樹脂の粘着力は、予測値で示します。点予測値は点推定値と同じです。一方、予測区間の区間幅には誤差分散VEが加わり、信頼区間より区間幅は大きくなります。

この例では、信頼率95%の予測区間の区間幅は以下となります。

予測区間は42.2±4.0、すなわち38.2から46.2となり、母平均の信頼区間よりかなり広がります。

<演習問題>

4つのグループから、6人ずつランダムに選んで、100m走のタイムを測定しました。4つのグループにおいてタイムの平均に有意差があるかどうかを調べてください。最も速いグループの母平均の信頼率95%の信頼区間はいくつでしょう。また、そのグループの人のタイムの予測区間はいくつでしょう(図3)。

グループ1: 17.1 17.2 16.0 18.1 13.1 16.3

グループ2: 14.7 14.4 15.1 15.8 17.5 17.4

グループ3: 15.9 14.2 12.0 13.7 11.9 15.0

グループ4: 16.4 16.8 13.8 18.0 15.2 19.1

>>第2回 第3章の続きを読む(PDFダウンロード)

第3回:二元配置法

前回は、一元配置法を紹介しました。今回は、2つの因子を同時に取り上げる二元配置法を解説します。二元配置法では、因子を1つずつ考える一元配置法よりも、効率的に実験を行うことができます。ただし、2つの因子間にある関係に注意が必要です。因子が特性に及ぼす要因として、因子による主効果だけでなく、因子間の交互作用を考慮して解析をしなければなりません。

1. 二元配置実験のしくみ

二元配置実験とは、2つの因子を組み合わせて同時に変化させて実験することをいいます。ある樹脂の粘着力を調べるために、処理温度と加工方法の2つを因子に取り上げ、樹脂の試作品について、粘着力の測定実験を行うことにしました。処理温度に加えて、加工方法を因子としたのは、加工方法の違いが粘着力に影響することが考えられるためです。処理温度は3水準を設定しています。また、加工方法には、従来法と新工法の2通りが考えられています。

それぞれの因子単独の効果を、主効果といいます。最適な処理温度は、加工方法によって違うかもしれません。つまり、従来法では120℃が最適でも、新工法では130℃が最適かもしれません。これが交互作用と呼ばれるものです。二元配置実験では、処理温度と加工方法の2つの主効果と、それらの交互作用、および誤差の4つの要因効果を調べます。

実験は、2つの因子の水準を組み合わせて行います。ただし、交互作用を調べるためには、それぞれの組み合わせにおいて繰り返し実験を行わなければなりません。6通りの組み合わせに対して、3回の繰り返しをすると、全部で18回の実験が必要になります。ここでも無作為化の原則は重要で、18回の実験はランダムな順序で行う必要があります。このとき得られたデータを、表1に示します。

表1:3通りの処理温度と2通りの加工方法における試作品の粘着力
  B1(従来法) B2(新工法) 合計 平均
A1(120℃) 42 43 41 41 42 40 TA1=249 xA1=41.5
A2(130℃) 39 39 42 45 43 44 TA2=252 xA2=42.0
A3(140℃) 39 38 40 39 39 42 TA3=237 xA3=39.5
合計 TB1=363 TB2=375 T=738  
平均 xB1=40.3 xB2=41.7   x=41.0

グラフを描いて考察してみましょう(図1)。B1(従来法)では、温度が高くなると粘着力が下がっています。一方、B2(新工法)では、A2(130℃)のときに粘着力が高くなり、120℃と140℃では下がっています。温度と工法の間には関連がありそうです。

図1:試作品の粘着力実験のグラフ

図1:試作品の粘着力実験のグラフ

データを解析してみましょう。総平方和STは全ての18個のデータから計算して、これを4つの要因平方和に分解します。まず、……

>>第3回 第1章の続きを読む(PDFダウンロード)

2. 最適水準における推定と予測

最も粘着力が高くなるのは、どの処理温度とどの加工方法のときでしょうか。また、そのときの粘着力はいくつになるでしょうか。最適水準を求めて、そこでの粘着力の母平均を推測し、粘着力の値を予測します。最適水準を決めるときには、交互作用の有無が重要になります。また、交互作用が存在するときは、2つの因子の組み合わせから最適な水準を決めなければなりません。

一方、交互作用がなければ、2つの因子の最適水準をそれぞれで求めます。ここでは、交互作用が存在しているため、6通りの水準組み合わせの中から最大となるA2B2水準、すなわち130℃で新工法を用いたときに粘着力が最大となることが分かります。

点推定は、その水準における平均で与えます。この例では、A2B2水準のときの平均44.0が点推定値です。区間推定では、信頼率α=0.95のとき、区間幅は以下のようになります。

r=3は水準組み合わせにおけるデータ数で、誤差分散VE=1.667と誤差自由度ϕE=12は分散分析表から分かります。従って、母平均の信頼区間は44.0±1.6、すなわち42.4から45.6となります。

Excelで信頼区間を求めるには、図3のように関数を入力してください。

図3:Excel関数による信頼区間の算出

図3:Excel関数による信頼区間の算出

130℃で新工法を用いて樹脂を加工した場合の粘着力を予測してみましょう。一元配置のときと同様に、点予測値は点推定値と同じで、予測区間の区間幅には誤差分散が加わります。この例では、信頼率95%の予測区間の区間幅は、以下のようになります。

予測区間は44.0±3.2、すなわち40.8から47.2となります。

<演習問題>

>>第3回 第2章の続きを読む(PDFダウンロード)

第4回:交互作用の考え方

前回は、二元配置法において交互作用が存在するときの解析方法を紹介しました。今回は、交互作用の考え方を説明します。また、交互作用が存在しないときの二元配置法を取り上げ、最適水準における推定や予測の方法を紹介します。3つ以上の因子を同時に取り上げる多元配置法への拡張についても解説します。

1. 交互作用

交互作用とは、2つの因子が組み合わさることで現れる相乗効果のことをいいます。前回、処理温度と加工方法の2つを因子に取り上げ、ある樹脂を加工する際の、粘着力の測定実験を行いました(図1の左図)。B1(従来法)では、処理温度が高くなるにつれて粘着力が下がり、B2(新工法)ではA2(130℃)のときに最も粘着力が高くなりました。つまり、工法によって最適な処理温度が変わります。これが交互作用です。

図1:試作品の粘着力実験のグラフ

図1:試作品の粘着力実験のグラフ

交互作用がなければ、図1の右図のようにグラフの折れ線はほぼ平行になります。工法によらず、処理温度が高くなると粘着力は下がります。グラフ化することで、交互作用の有無や強さを、直感的に把握できるようになります。

交互作用を適切に把握することは、とても重要です。そのためには、……

>>第4回 第1章の続きを読む(PDFダウンロード)

2. 交互作用のプーリング

要因配置実験では、要因効果があると考えられる因子を取り上げ、実験を行います。そのため、主効果は存在していると考えます。一方、交互作用については、要因効果があるかどうかははっきりとしないことが多いため、効果の有無を確認することになります。交互作用がなければ、それぞれの因子を独立に考えます。交互作用があれば、2つの因子は別々にではなく、組み合わせで考える必要が生じます。

分散分析の検定結果において、有意であれば要因効果があるといえます。しかし、有意でないということは、要因効果があるとはいえないということで、要因効果がないわけではありません。例えば、有意水準5%を基準にして効果の有無を判断すると、実際には効果があるにもかかわらず、ないと判断してしまう誤り(第2種の過誤)が生じる確率が高くなってしまいます。

そこで、有無の判断をする基準を約20%にまで下げます。この基準を適用しやすくする目安として、F値が2以下の要因は効果がないと判断します。ただし、……

>>第4回 第2章の続きを読む(PDFダウンロード)

3. 繰り返しのない二元配置法

2つの因子を取り上げるとき、技術的にもそれらに交互作用が存在しないと考えられるのであれば、主効果だけを検出できるような二元配置実験を行うこともあります。これが、繰り返しのない二元配置法です。繰り返しをしないため、実験回数は半分以下にまで減らすことができます。

繰り返しのない二元配置法の例として、処理温度と配合比率を取り上げ、粘着力に影響しているかを調べてみます。この場合、処理温度と配合比率には交互作用はないと考えられています。処理温度と配合比率にそれぞれ3水準を設定し、9通りの水準を組み合わせて1回ずつ実験を行ったところ、表1のデータが得られました。

表1:処理温度と配合比率における試作品の粘着力
  B1 B2 B3 合計 平均
A1 (120℃) 40 42 47 129 43.0
A2 (130℃) 38 40 44 122 40.7
A3 (140℃) 38 39 41 118 39.3
合計 116 121 132 369  
平均 38.7 40.3 44.0   41.0

繰り返しがないため、交互作用の平方和は計算できません。公式通りに計算すると、誤差平方和と一致します。総平方和STは、処理温度(A)によるばらつきを表す要因平方和SAと、配合比率(B)によるばらつきを表す要因平方和SB、および誤差平方和SEに分解されます。この数値例では、次の式のように計算されます。

これらの計算結果を分散分析表にまとめました(表2)。処理温度の主効果A、加工方法の主効果Bはいずれも有意となり、粘着力に影響を及ぼしていることが分かります。

表2:分散分析表
要因 平方和 自由度 平均平方 F値 P値 F境界値
A 20.67 2 10.33 8.86 0.034 6.94
B 34.67 2 17.33 14.9 0.014 6.94
E 4.66 4 1.17      
T 60.00 8        

ここまでの計算をExcelで行うには、……

>>第4回 第3章の続きを読む(PDFダウンロード)

4. 最適水準における推定と予測

交互作用がない場合、処理温度と配合比率の最適水準は、2つの因子の組み合わせで決めるのではなく、それぞれの因子ごとに決めます。例えば、処理温度の3水準を比較すると、A1水準のときに最大となっています。配合比率の3水準を比較すると、B3水準の時に最大となっています。従って、A1B3水準が最適水準となります。

点推定値は、A1水準の平均とB3水準の平均から求めます。A1水準の平均は、全体平均μにA1水準の効果a1が加わり、μ+a1と考えます。同様にB3水準の平均は、全体平均μにB3水準の効果b3が加わり、μ+b3と考えます。このとき、A1B3水準の平均は、全体平均μにA1水準の効果a1とB3水準の効果b3が加わり、μ+a1+b3と考えます。そのため、以下のように分解できます。

μ+a1+b3 = (μ+a1)+(μ+b3)-μ = (A1水準の平均)+(B3水準の平均)-(全体平均)

これにより、A1B3水準の平均μ(A1B3)の点推定値は、

となります。A1B3水準における観測値47ではないことに注意してください。

区間推定における区間幅の計算には、繰り返し数が用いられます。これは、点推定値を計算するときのデータ数と考えることができます。しかし、ここでの点推定値は3つの平均を使って算出しているので、……

>>第4回 第4章の続きを読む(PDFダウンロード)

5. 三元配置法

3つ以上の因子を同時に取り上げて配置実験を行うのが、多元配置法です。現実的には4つ以上の因子を取り上げることは少ないため、3つの因子を取り上げたときを三元配置法と呼びます。多くの因子を取り上げると、それらの組み合わせ数は膨大になります。交互作用を検出するには、さらに多くの繰り返し実験が必要になります。

三元配置法の例を考えてみましょう。処理温度、加工方法、配合比率の最適な組み合わせを見つけます。処理温度を3通り、加工方法を2通り、配合比率を3通りに設定した場合、それらの水準組み合わせは18通りになります。考えられる要因には、3つの主効果の他に、2因子間の交互作用が3つと、3因子間の交互作用が1つあり、合計7つとなります。これらを全て検出するには、少なくとも36回の実験を行う必要があります。

要因平方和は、二元配置法と同様に求めます。因子Bと因子Cの間の交互作用の平方和は、

SB×C = SBC-SB-SC

で求めます。3つの因子間の交互作用の平方和は、

SA×B×C = SABC-SA-SB-SC-SA×B-SA×C-SB×C

として求めます。

SABCは、ABCの水準組み合わせから計算するもので、そこには3つの因子A、B、Cによってもたらされる全ての平方和が含まれます。従って、A、B、Cの主効果と A×B、A×C、B×Cの交互作用を引くことで、A×B×Cの平方和を求めることができます。ただし、計算は煩雑になり、Excelの分析ツールにも用意はありませんが、シート上で平方和を計 算し、分散分析表を求めることはできます。

2因子間の交互作用の場合、技術的な意味を考えることは容易に可能です。しかし、3つの因子間の交互作用は、なかなか説明しにくいものです。三元配置法においては、2因子交互作用を3つ考えているため、これ以外の3因子交互作用は考えないということもあり得ます。もし、3因子交互作用を取り上げないのであれば、各水準における繰り返しは必要ではなくなります。その場合でも、2因子交互作用を検出することは可能です。

<演習問題>

>>第4回 第5章の続きを読む(PDFダウンロード)

第5回:乱塊法

前回は、交互作用の考え方を紹介しました。今回は、初めに変量因子について説明します。特性に影響を与える因子には、実験者が制御できないものがあります。例えば、使用環境に気温が影響している場合などです。寒い日もあれば暑い日もあるので、最適な気温を設定しても意味はありません。このような因子にはばらつきはあるものの、水準を指定できないため再現性がありません。これを変量因子といいます。また、今回は、乱塊法の仕組みと、最適水準における推定や予測方法についても説明します。乱塊法とは、変量因子を計画に取り入れることで、変量因子のばらつきをとらえ、解析の精度を上げる手法です。

1. 局所管理

データを記録するとき、実験を行う時間帯や場所(系統誤差)に影響を受ける可能性があります。局所管理とは、その際に実験を行う時間帯や場所を均等にした条件(ブロック)を作り、そのブロック内でのバックグラウンドができるだけ均一になるように配慮することをいいます。

特性に影響を与えはするものの、最適な水準を決めることに意味のない因子があります。例えば、タイヤの摩耗量は走行路の状態に影響を受けます。タイヤの摩耗性を比較するとき、あるタイヤは舗装道路では摩耗量が少なかったとしても、舗装道路しか走行しないわけではないので、そのタイヤが優れているとはいえません。さまざまな道路を走行した上で、タイヤの摩耗量を比較しなければなりません。この場合、走行路の状態は重要な因子となるものの、その最適水準を特定することには意味はありません。このような因子を、変量因子といいます。

一方、これまで扱ってきた処理温度や配合比率のような因子は、最適水準を設定することで特性を高めることが期待できます。このような因子を母数因子といいます。

変量因子の水準を決めずに実験を行うと、そのばらつきも誤差と見なされ、誤差分散が大きくなります。つまり、走行路の違いによるばらつきも誤差と見なされます。その結果、分散分析を行っても、要因効果を適切に検出できなくなります。

乱塊法では、変量因子をいくつかのブロックに分けることで変量因子の及ぼす影響を定量的に捉え、誤差分散を精度よく求めます。このときの変量因子は、ブロック分けに用いる因子ということで、ブロック……

>>第5回 第1章の続きを読む(PDFダウンロード)

2. 乱塊法のしくみ

乱塊法とは、実験全体を無作為化するのではなく、局所管理の考えに基づいてブロック因子を導入し、ブロック内で無作為化を行う方法です。開発した3種類のタイヤについて、摩耗量に違いがあるかを調べるために実験を行います。走行路をブロック因子として5水準を設定し、それぞれに走行試験を行って摩耗量を測定しました。その結果を表1に示します。タイヤの種類が母数因子、走行路が変量因子となります。

表1:走行試験のデータ
  舗装 石畳 登板 凍結 湿潤 合計 平均
タイヤ1 10.8 12.2 11.9 8.5 9.2 52.6 10.52
タイヤ2 10.9 12.7 12.2 8.3 9.3 53.4 10.68
タイヤ3 10.1 11.4 11.9 8.1 9.1 50.6 10.12
合計 31.8 36.3 36.0 24.9 27.6 156.6  
平均 10.60 12.10 12.00 8.30 9.20   10.44

これは、タイヤと走行路の2つの因子を取り上げた、繰り返しのない二元配置実験と同じデータです。ここで最適水準を求めるのは、母数因子のタイヤです。もし、変量因子として走行路を考えなければ、1つの因子としてタイヤ(A)を取り上げた繰り返し5回の一元配置実験と見ることができます。その場合、……

>>第5回 第2章の続きを読む(PDFダウンロード)

3. 最適水準における推定と予測

摩耗量が最も少ないのは、タイヤ3で凍結路を走行したときです。しかし、走行路を決めても意味がないので、最適水準として求めるのは、母数因子のタイヤに関してのみです。従って、各タイヤの摩耗量を比較して、タイヤ3が最も摩耗量が少ないといえます。

次に、タイヤ3の摩耗量の母平均の推定を行います。点推定値は10.12です。区間推定では、区間幅を考えるとき、点推定値の分散を誤差分散から求めていました。しかし、ばらつきの要因は誤差だけでなく、走行路によるばらつきもあります。因子RによるばらつきはVRから求めます。実はこのVRには誤差分散σ2と因子Rによる分散σR2が含まれています。誤差分散σ2の推定値はVE、σ2+rσR2の推定値はVRです。ここで、rは因子Rの各水準におけるデータ数で、r=3です。これより、因子Rによる分散の推定値σ^2Rは、以下のように求められます。

個々のデータの分散は、

です。因子Aの各水準におけるデータ数をaとすると、点推定値の分散の推定値は

となります。これより、信頼区間の区間幅は

で与えられます。

ここで、t分布の自由度ϕにも注意が必要となります。これまでは誤差自由度を用いていました。しかし、ここではVEとVBの2つの分散の自由度から算出しなければなりません。そこで用いられるのがサタースウェイトの等価自由度と呼ばれるものです。一般に、自由度ϕ1の分散V1と自由度ϕ2の分散V2の重み付き和c1V1+c2V2の自由度ϕは、以下によって求められます。

この例では、r=3、a=5なので、……

>>第5回 第3章の続きを読む(PDFダウンロード)

4. 水準間の差の推定

最適水準における信頼区間や予測区間は、とても広いものになっています。それはブロック因子のばらつきを含んだものになるため、各水準における母平均には、変量因子の影響が大きく現れているからです。

前節では、最適水準における推定と予測の方法を説明しました。しかし、水準間の差がいくつあるかを調べることの方が大切です。つまり、タイヤの摩耗量を見るのではなく、最適なタイヤは他のタイヤと比べてどれだけ優れているかを見ます。

乱塊法では、変量因子のそれぞれの水準で同様に実験をしているため、母数因子の水準間の差を取ると、変量因子の影響を排除できます。つまり、タイヤ間の母平均の差には、変量因子Rの分散は含まれません。タイヤ3とタイヤ1の差を考えてみます。摩耗量の母平均の差を点推定すると、以下のようになります。

点推定値の分散は

となり、信頼区間の区間幅には誤差分散しか現れず、

で与えられます。区間推定における区間幅は

となります。従って、信頼区間は0.40±0.39、すなわち0.01から0.79となります(図2)。

図2:Excel関数によるタイヤ3とタイヤ1の信頼区間の算出

図2:Excel関数によるタイヤ3とタイヤ1の信頼区間の算出

<演習問題>

ある洋菓子店では、新たに3種類のケーキを作り、……

>>第5回 第4章の続きを読む(PDFダウンロード)

第6回:直交配列表実験の計画

前回は、乱塊法の考え方を紹介しました。多くの因子を取り上げると、水準組み合わせの数は膨大になってきます。直交配列表実験は、一部の水準組み合わせで実験することで、必要な要因効果を検証可能にします。今回は、全ての因子が2水準に設定された、2水準系直交配列表実験の仕組みを説明します。

1. 部分配置実験の考え方

要因配置実験は、全ての水準組み合わせで実験するのに対し、部分配置実験では、一部の水準組み合わせで実験します。因子が多くなると、水準組み合わせの数も多くなります。例えば、5つの因子をそれぞれ2水準に設定したとき、水準組み合わせの数は25で32通りになります。一方で、5つの因子がある場合、主効果は5つ、ただし、2因子間の交互作用は10通りあります。さらに、3因子間が10個、4因子間が5個、5因子間が1個あるため、合計すると31個になります。従って、少なくとも32回の実験をしないと、全ての要因を検出できません。

しかし、本当に31個全ての要因を調べないといけないのでしょうか? 3因子間以上の交互作用は、技術的にも説明しにくく、存在しないと考えることが一般的です。2因子間の交互作用でも、互いに関連がなさそうなものもあります。仮に、2因子間交互作用のうち4つについて検証したいなら、全部で9つの要因を検証すればよいので、少なくとも10回の実験でよいことになります。このように、取り上げる要因を絞ることによって、実験回数を抑えられる可能性が出てきます。

まず、3つの因子A、B、Cで、交互作用は考えない場合で説明します。全て2水準を設定すると、23で8通りの水準組み合わせができます(表1)。

表1:8通りの水準組み合わせ
NO 水準組み合わせ データの構造
1 A1B1C1 x1=μ+a1+b1+c11
2 A1B1C2 x2=μ+a1+b1+c22
3 A1B2C1 x3=μ+a1+b2+c13
4 A1B2C2 x4=μ+a1+b2+c24
5 A2B1C1 x5=μ+a2+b1+c15
6 A2B1C2 x6=μ+a2+b1+c26
7 A2B2C1 x7=μ+a2+b2+c17
8 A2B2C2 x8=μ+a2+b2+c28

ここで、a1というのは、因子Aを第1水準に設定したときに、全体平均μよりどれだけ大きくなるかを表すものです。a2は第2水準のときなので、a1+a2=0となります。

同様に、b1+b2=0と、c1+c2=0も成り立ちます。No.1の実験ではA1B1C1水準なので、全体平均μにa1、b1、c1の効果と、誤差ϵ1が加わって観測されると考えます。

A1水準の合計とA2水準の合計を計算すると、b1+b2=0、c1+c2=0なので、以下のようになります。

T(A1) = x1+x2+x3+x4=4μ+4a1+(ϵ1234)

T(A2) = x5+x6+x7+x8=4μ+4a2+(ϵ5678)

ここで、因子Bと因子Cの効果は消えています。Aの各水準において、BとCの水準が等しく実験されているからです。ここで、Aの水準間の差を取ると、……

>>第6回 第1章の続きを読む(PDFダウンロード)

2. 直交配列表のしくみ

直交配列表実験は、直交配列表(直交表)を利用して、少ない実験回数で各因子の効果や因子間の交互作用の効果を測定できるようにした方法です。表3は、2水準系の直交配列表の一例です。4行3列の表に、1と2が入っています。各列に注目すると、どの列にも1と2が同数あります。そして、任意の2列には、(1,1)、(1,2)、(2,1)、(2,2)の4通りの組み合わせが同数あります。

表3:L4(23)直交配列表

この表は4行3列の2水準系であることから、L4(23)と表記されます(図1)。

図1:直交表の表記

図1:直交表の表記

この表を用いて水準組み合わせを決めるには、各列に因子を割り付けます。表3にあるように、因子Aを第1列、因子Bを第2列、因子Cを第3列に割り付けたとすると、No.1では、各因子はA1水準、B1水準、C1水準で実験を行うことを表しています。このようにして求めた4通りが、表2に示した水準組み合わせです。

直交配列表は、どの列にも1と2が同数あることと、……

>>第6回 第2章の続きを読む(PDFダウンロード)

3. 直交配列表への割り付け

実際によく用いられる直交配列表は、L16(215)直交配列表です(表5)。15列あるため、最大で15個の要因を割り付けることができます。

表5:L16(215)直交配列表

多くの因子を取り上げると、考慮すべき交互作用も多くなります。それらが他の要因と交絡しないように因子を割り付けなければなりません。前述のように、成分表示を使って割り付けることもできます。また、主効果と交互作用の関係を表す線点図があらかじめ用意されており、これを使って割り付けることもできます。

図2に、L16(215)直交配列表の3つの線点図を示します。頂点が主効果に対応し、それらを結ぶ線分が交互作用を表します。例えば、……

>>第6回 第3章の続きを読む(PDFダウンロード)

ピックアップ記事

tags