メインコンテンツに移動

ANOVAと多重対比較の矛盾する結果の解釈の仕方は?

この記事は、ANOVA と 多重対比較, (事後比較:post hoc comparisonsともいう)の矛盾する結果を解釈する方法を説明します。

多重比較ツールに関する簡単な説明

ãªãœå¤šé‡å¯¾æ¯”è¼ƒæ¤œå®šã‚’ä½¿ç”¨ã™ã‚‹å¿ è¦ãŒã‚ã‚‹ã®ã‹?

ANOVA ã®ç›®çš„ã¯ã€ã‚ã‚‹å› å­ãŒå¾“å±žå¤‰æ•°ã«å¯¾ã—ã¦å ¨ä½“çš„ã«æœ‰æ„ãªåŠ¹æžœã‚’æŒã¤ã‹ã©ã†ã‹ã‚’æ¤œå‡ºã™ã‚‹ã“ã¨ã§ã™ã€‚ãŸã¨ãˆã°ã€å–«ç ™ãŒè‚ºã®å¥åº·ã«ã©ã®ã‚ˆã†ã«å½±éŸ¿ã™ã‚‹ã‹ã‚’ç ”ç©¶ã—ã¦ã„ã‚‹ã¨ã—ã¾ã—ã‚‡ã†ã€‚å–«ç ™ã¯ã€4 つの集団 (non-smokers, passive smokers, light smokers and heavy smokers)ã«é–¢ä¸Žã™ã‚‹å› å­ã§ã™ã€‚

ANOVAãŒå–«ç ™ã®è‚ºã®å¥åº·ã¸ã®æœ‰æ„ãªåŠ¹æžœã‚’æ¤œå‡ºã™ã‚‹ã¨ä»®å®šã—ã¦ã€æˆ‘ã€ ã¯ã•ã‚‰ã«ã‚¹ãƒ†ãƒƒãƒ—ã‚’é€²ã‚ã¦ã€ç‰¹å®šã®é›†å›£ãŒä»–ã¨æœ‰æ„ã«ç•°ãªã‚‹ã‹ã©ã†ã‹ã‚’æ¤œè¨Žã§ãã¾ã™ã€‚ã“ã®ç›®çš„ã®ãŸã‚ã«ã€æˆ‘ã€ ã¯ã™ã¹ã¦ã®ç¾¤ã®å¯¾ã®é–“ã®å·®ã‚’æ¤œå®šã™ã‚‹å¿ è¦ãŒã‚ã‚Šã¾ã™ã€‚ 多重対比較検定(Pairwise multiple comparisons tests)、または事後検定( post hoc tests)は、この問題に取り組むためのツールです。

多重比較問題とは何か?

多重対比較検定は、比較される群の各対の p値の計算を伴います。p値は、それが真ではないにもかかわらず、ある効果が統計的に有意であると主張する危険度を表します。対比較の数が増大すると、p値の数も増大するので、現実的な偶然のせいで有意な効果が検出されやすくなります。たとえば、5%の有意水準アルファだとして、100個の有意 p値から5個の有意p値が偶然的に見つかることになります。

この問題を解決するために、多重対比較検定ではp値の補正を行います: 比較の数が増大するほど、p値がペナルティ化され(= 値が増大され)ます。したがって、間違った推論を引き出すことが少なくなります。på€¤ã®ãƒšãƒŠãƒ«ãƒ†ã‚£åŒ–æ‰‹é †ã¯ã€*事後検定*の間で異なることに注意してください。

XLSTATを用いたExcelでのANOVAと続く多重比較の実行方法については、こちらのチュートリアルをご確認ください。

ANOVAと多重対比較の矛盾する結果の解釈

上記で説明されたように、ANOVAと多重対比較検定は、異なる問題を検討します。ANOVA ã§æä¾›ã•ã‚Œã‚‹å›žç­”ãŒã€å¤šé‡å¯¾æ¯”è¼ƒã§æä¾›ã•ã‚Œã‚‹å›žç­”ã¨çŸ›ç›¾ã™ã‚‹å ´åˆãŒã‚ã‚Šã¾ã™ã€‚

ANOVAが有意で多重対比較が非有意

この結論は、次のときに引き出されます:

  • ANOVAで計算されたp値が、有意水準アルファ(たとえば、0,05)以下のとき。
  • 多重対比較検定で計算されたすべてのp値が、有意水準アルファよりも高いとき。

以下に事例を表示します:

Significant ANOVA with non-significant multiple pairwise comparisons 主効果が有意であると見なされる有意な差を事後検定が検出しないような複数のケースがあります。

ãã‚Œã¯ã‚µã‚¤ã‚ºã®å°ã•ã„æ¨™æœ¬ã§èµ·ãã¾ã™ã€‚ã“ã®å ´åˆã€æˆ‘ã€ ã¯çµ±è¨ˆçš„æ¤œå®šåŠ›ã®ä¸è¶³ã¨ã—ã¦ã€ãã®çµæžœã‚’è§£é‡ˆã§ãã¾ã™ã€‚å¯¾æ¯”è¼ƒæ¤œå®šãŒçµ±è¨ˆçš„ã«å¼·åŠ›ã§ã¯ãªã„å ´åˆã€æœ‰æ„ãªå·®ã‚’æ¤œå‡ºã—ã«ãããªã‚Šã¾ã™ã€‚

ã¾ãŸå› å­æ°´æº–ãŒå¤šã™ãŽã‚‹å ´åˆã«ã‚‚ã€ãã‚ŒãŒèµ·ãã¾ã™ã€‚å¯¾æ¯”è¼ƒãŒå¤šã„ã»ã©ã€p値がよりペナルティ化されます。したがって、それが真であるにもかかわらず、帰無仮説が棄却されるリスクが減少します。Â

また主効果がわずかに有意な(有意水準に等しいか近い)ときにも、それが起きます。

結果的に、多重対比較ツールの選択は、そのような結果の解釈も助けます。より保守的なツールは、現実に意味のある平均間の差を棄却しやすいです。

ANOVAが 非有意で多重対比較が有意

この結論は、次のときに引き出されます:

  • ANOVAで計算されるp値が 、有意水準アルファ(たとえば、e.g. 0,05)よりも高いとき。
  • 多重対比較検定で計算される少なくとも1つのp値が、有意水準アルファよりも低いとき。

以下に事例を表示します:

An unfortunate common practice is to pursue multiple comparisons only when the hull hypothesis of homogeneity is rejected. (Hsu, page 177).

å ´åˆã«ã‚ˆã£ã¦ã¯ã€ANOVAãŒé‡è¦ãªã‚°ãƒ­ãƒ¼ãƒãƒ«åŠ¹æžœã‚’ç¤ºã•ãªã„å ´åˆã§ã‚‚ã€ãƒã‚¹ãƒˆãƒ›ãƒƒã‚¯ãƒ†ã‚¹ãƒˆã¯ã‚°ãƒ«ãƒ¼ãƒ—é–“ã®é‡è¦ãªé•ã„ã‚’è¦‹ã¤ã‘ã‚‹ã®ã«ååˆ†å¼·åŠ›ã§ã™ã€‚ 一般に、そのような結果は有効です。 しかし、ポストホックテストの結果が重要でないANOVA(フィッシャーLSDなど)の後に有効であると考えることができないという例外があります。

Was this article useful?

  • Yes
  • No