交互作用もわかる!二元配置分散分析の手順を具体例で解説

Pocket

実験風景 実験

当連載コラム「これならわかる実験計画法」の統計編では、「果物屋さんで売っている桃の中から甘い桃を見分ける方法」という題材を例として、どのような実験を計画し、得られた実験結果をどのように分析すれば合理的な結論が得られるのかを説明しています。
(※題材については、統計編の第1回「《実験計画法と統計》推定と仮説検定の考え方」をご参照ください。)

今回の内容は、前回の「一元配置分散分析の具体的な手順をわかりやすく解説!」の中で説明した、桃の糖度に影響を及ぼす要因を見つける実験の続きです。

前回解説した一元配置分散分析では、「サイズ」という1つの因子について、3つの水準を決めて分散分析を行い、サイズによって糖度に違いがあるという結果を得ました。同様に「色」という1つの因子について、2つの水準を決めて分散分析を行いましたが、こちらでは色によって糖度の違いがあるとは言えないという結果でした。「サイズ」と「色」を別々の実験として扱うと、組み合わせによる効果(交互作用)は検出できません。

そこで今回説明する二元配置分散分析を用いると、「サイズ」「色」という2つの因子について、2つの因子単独の効果(主効果と言います)が調べられるとともに、交互作用も調べることが可能です。

それでは、二次元配置分散分析のやり方を、具体的な実験例にあてはめながら、できるだけわかりやすく説明していきます。

1.二元配置分散分析と「ばらつき」の分解

二元配置分散分析でも、一元配置分散分析と同じように、ばらつきを分解して考えていきます。
表1の「大」「濃い」のデータに注目してみましょう。

 

【表1 桃の色とサイズ毎の糖度のデータ】
桃の色とサイズ毎の糖度のデータ

 

図1の注目するデータは、全体平均から「全体」と書いた黒矢印の分だけずれています。
 

データのばらつきの構造
【図1 データのばらつきの構造】

 

これは、
 ・色の効果である「濃い」の平均の全体平均からのずれ(橙矢印)
 ・サイズの効果である「大」の平均の全体平均からのずれ(赤矢印)
を足し合わせ、さらに
 ・色の効果とサイズの効果の交互作用
によって補正した、「大」「濃い」の平均に、誤差を加えたものになっています。

 

全体のばらつき

 
このように、二元配置分散分析でも、一元配置分散分析と同じように、ばらつきを分解して考えていきます

 

2.二元配置分散分析の具体的な手順

これまでも使ってきた、表1に加え、交互作用を見るために右のように組み合わせごとの平均値も算出しておきます(表2)。

 

【表2 桃の色とサイズ毎の糖度のデータと組みわせの平均値】
桃の色とサイズ毎の糖度のデータと組みわせの平均値

 

全体のばらつきを要因効果と誤差によるばらつきに分解します。

 

全体のばらつきを要因効果と誤差によるばらつきに分解

 

  • ① [データ-全体平均]の平方和
  • ② [サイズの水準平均-全体平均]の平方和
  • ③ [色の水準平均-全体平均]の平方和
  • ④ [組み合わせの平均-サイズの水準平均-色の水準平均+全体平均]の平方和
  • ⑤ [データ-組み合わせの平均]の平方和

⇒一元配置分散分析と同じように、それぞれの平方和を計算します。

一元配置の場合は、全体の平方和から一つの要因効果の平方和を引いて残りを誤差としましたが、二元配置では、残りの中からもう一つの要因効果の平方和を引いて残りを誤差とし、さらにその誤差から交互作用の平方和を引いて、最終的に残りを誤差としています。

つまり、サイズに注目する時は③④⑤を誤差とみなし、色に注目する時は、②④⑤を誤差とみなしていることになります。
なお、この例題では「大、濃い」などの1つの組み合わせに2つのデータがありますが(繰り返しのある二元配置実験と言います)、繰り返しがないと交互作用と誤差が分離できません。また、交互作用によるばらつきが上の④のように書けることは直感的にはわかりにくいですが、数学的な証明(ここでは省きます)は可能です。

 
統計編第3回のコラム「F検定とは?分散分析による検定の基本を解説」で説明した分散分析の基本的な手順に則って、進めていきます。

 

(1)帰無仮説の設定

次の3点を帰無仮説に設定します。

  • (1) 桃のサイズと糖度は相関していない
  • (2) 桃の色と糖度は相関していない
  • (3) 桃のサイズと色の組み合わせと糖度は相関していない

 

(2)有意水準の設定

「めったに起きない」の基準を5%に設定します。

 

(3)統計量の算出

実際に上の計算を行って、統計量を算出すると表3のようになります。

 

【表3 分散分析表】
分散分析表

 

【表4 自由度φA、φEのF分布表(抜粋)】
自由度φA、φEのF分布表(抜粋)

 

ここで、
◆因子の自由度(φA、φB)=水準数-1
◆交互作用の自由度(φAxB)=φA x φB=2×1=2
◆誤差の自由度(φe)=φT-φA-φB-φAxB =11-2-1-2=6
です。
もし繰り返しがないと、Tの自由度は5になり(データ数-1)、Eの自由度が0になってしまいます。これはAxBとEが分離できないことを意味します。

分散分析表のF0とF(0.05)の大きさを比べて(表4参照)、帰無仮説(1) (2) (3)は有意水準5%ですべて棄て、有意水準5%で桃のサイズ、色、サイズと色の組み合わせによる効果あり、と判定されます。

しかし、前回のコラムで説明した、色に注目した一元配置実験では、色により糖度に違いがあるとは言えませんでした。これはどういうことでしょうか?

実は、上のように交互作用が検出された場合、因子(サイズ、色)の主効果の有無は単純には議論できません。交互作用があるということは、片方の因子の水準によって、もう片方の因子の効果が異なるということですから、一方の因子の水準を固定したうえで他方の因子の主効果の有無を検討することが必要です。

図2には、これまで検討してきた桃の糖度のデータを、「色が濃い」を赤で、「色が薄い」を青で示していますが、誤差によるばらつきが小さいので、分散分析をしなくても図から次のことが読み取れます。

  • 色が濃い場合も、薄い場合も桃のサイズの主効果はある。ただし、色によってサイズの効果の現れ方は違う。
  • 桃のサイズが大、あるいは小の場合、桃の色により糖度に差はないが、サイズが中の場合、色の主効果がある。

このように、2因子以上の分散分析では、まず最初に交互作用の有無を確認することが重要で、交互作用がない時に限り各因子の主効果を、他の因子の存在を気にせず議論することができます。

 

桃のサイズ、色が糖度に及ぼす影響
【図2 桃のサイズ、色が糖度に及ぼす影響】

 

(4)最適水準の決定

交互作用の有無によって最適水準の求め方が変わります。
交互作用がある場合、二つの因子を一緒にして考え、すべての水準組み合わせの中で最大となる水準が最適水準になります。
今回の例の場合、上のように交互作用がありましたから、サイズ・色の組み合わせの平均値が最大であるサイズ「中」・色「濃い」が最適水準で、最適水準における母平均の点推定値は、14.65 ということになります。

 

【表5 最適水準と母平均の点推定値】
最適水準と母平均の点推定値

 

図3のような、平均値のグラフからも視覚的な情報が得られます。
交互作用がないと、一番右側のグラフは平行になります。

 

桃のサイズ、色が糖度に及ぼす影響
【図3 桃のサイズ、色が糖度に及ぼす影響】

 

3.実験計画法コラム「統計編」の終わりに

「これならわかる実験計画法」の統計編では、桃の糖度は何と相関があるかを調べる実験を例に、実験計画法と分散分析の基本について述べてきました。
読んで下さった方の中には、「結局上のようなグラフを作って判断した方が早いじゃないか」と思われた方もいらっしゃるかもしれませんが、実際の実験ではもっと多くの因子について、もっと多くの水準のデータを扱うことも稀ではなく、すべての因子、水準について上のようなグラフを作って判断することは、現実的ではありません。

そんな時でも、実験計画法ではどういう仕組みで分析しているのかを理解していれば、実験方法を設計する際や、データを分析する際に、間違った判断を防ぐことができるようになるのです。
 
 
(日本アイアール株式会社 H・N)

 

 

Pocket

関連するセミナー

製造業eラーニングTech e-L講座リスト

製造業向けeラーニングライブラリ

アイアール技術者教育研究所の講師紹介

製造業の新入社員教育サービス

技術者育成プログラム策定の無料相談受付中

スモールステップ・スパイラル型の技術者教育

技術の超キホン

機械設計マスターへの道

生産技術のツボ

早わかり電気回路・電子回路

早わかり電気回路・電子回路

品質保証塾

機械製図道場

スぺシャルコンテンツ
Special Contents

導入・活用事例

テキスト/教材の制作・販売