はじめに
統計解析の結果を見る時、私たちはつい「この介入は効果があるか?」という問いに集中しがちです。しかし実際の臨床現場では、「どんな患者に」「どんな条件で」効果があるかのほうが重要なことも多いのではないでしょうか。
たとえば「リハビリを長くやれば筋力が回復する」という点だけを見ていると、「若い患者では効果が大きいが、高齢患者では効果が乏しい」という重要な情報を見落とすかもしれません。
この「条件によって効果の大きさや方向が変わる現象」を統計では**交互作用(interaction)**と呼びます。
この記事では、交互作用の概念から検出方法・定量化・注意点まで一通り解説します。
交互作用とは何か
交互作用とは「ある要因の効果が、別の要因の水準によって変わること」です。
交互作用が生じた場合、その現れ方によって相乗効果(効果が強まる)と相殺効果(効果が弱まる)に分けることができます。ただし統計学では、こうした効果の強弱にかかわらず「交互作用がある」と言います。
日常的な例では、「カフェインの覚醒効果は睡眠不足の状態でより顕著になる」「湿度が高いほど、気温上昇が不快感に与える影響が大きくなる」などが挙げられます。
臨床例で理解する交互作用【あるある編】
例①:体位変換プロトコル × 認知症の有無 → 褥瘡発生率
褥瘡予防のための体位変換プロトコルは、認知機能が保たれている患者では有効に機能します。しかし認知症を伴う患者では、本人の協力が得られにくく、体位変換の効果が減衰することがあります。
- 認知症なし:プロトコル実施により褥瘡発生率が大幅に低下
- 認知症あり:プロトコル実施の効果が限定的
「体位変換プロトコルは褥瘡予防に有効」という主効果の結論は正しいとしても、認知症の有無という交互作用を見落とすと、ケア計画を誤ることになります。
例②:抗菌薬用量 × 慢性腎不全の有無 → 治療効果・副作用リスク
抗菌薬は用量を増やすほど治療効果が高まる傾向があります。しかしこの関係は腎機能(eGFR)によって大きく変わります。
- 腎機能正常:用量増加 → 治療効果の増大
- 慢性腎不全:薬剤の排泄が遅れ、通常用量でも血中濃度が過剰になり副作用が先に出る
用量と治療効果の関係だけを見ていると、腎機能低下患者への過量投与をする可能性があります。
例③:訓練時間 × 年齢 → 筋力回復量
脳卒中後の筋力回復において、訓練時間を増やすほど回復量が大きくなる傾向があります。しかしこの効果は年齢によって大きく変わります。
- 40歳以上群:リハ時間が多いほど筋力が大きく改善する
- 60歳以上群:リハ時間が多いほど筋力が改善する
- 90歳以上群:リハ時間が多いほど筋力が改善するが、改善量の増加が限定的
全患者を平均して「訓練時間の延長は筋力回復に非常に有効」と考えると、予後予測を見誤る可能性があります。
※これらの例は臨床像を反映したものではありません。たとえ話なので、事実と異なる可能性があります。
交互作用の「見落とし」問題
交互作用を見落とすと、主に以下の2つの場面で臨床判断を誤るリスクがあります。
① 全体では有効に見えても、特定の患者層では効果が薄い(または有害)
全患者を平均すると「介入群のほうが有意に改善」という結果が出ていても、特定の患者層では介入の効果がなかったり、むしろ悪影響が出ていることがあります。
以下は架空のデータによるイメージです。
| 群全体での改善量 | 90歳未満の効果 | 90歳以上の効果 | |
|---|---|---|---|
| 介入群 | +9点 | +12点 | −1点 |
| 対照群 | +2点 | +2点 | +2点 |
| 差 | +7点(有意) | +10点(有意) | −3点(有意) |
全体の結果だけを見れば「介入は有効」という結論になります。しかし90歳以上の層に限ると、介入群のほうが悪化しています。交互作用を確認せずに全体の結果だけを報告すると、特定の患者層への有害な介入を見落とすことになります。
② 全体では効果がないように見えても、特定の患者層では有効
全体の解析では「有意差なし=効果なし」という結論になっても、特定の患者層では明確な効果がある場合があります。
以下は架空のデータによるイメージです。
| 全体の効果 | 脳梗塞 | 脳出血 | くも膜下出血 | |
|---|---|---|---|---|
| 介入群 | 5 | +7 | +4 | +4 |
| 対照群 | 2 | +1 | +2 | +3 |
| 差 | 3(有意差なし) | +6(有意差あり) | 2(有意差なし) | 1(有意差なし) |
全体では有意差が出ていませんが、脳梗塞の患者層に限ると明確な効果が確認できます。交互作用を検討しなければ「この介入は無効」と誤って結論づけ、本当に恩恵を受けられる患者を見逃すことになります。
共通のポイント
どちらのパターンでも共通するのは「全体の平均で判断すると、臨床判断を誤る可能性がある」という点です。平均的な効果が「あり」でも、特定の属性を持つ患者群では効果がない・あるいは有害であることが起こりえます。交互作用の検討は、個別化医療・患者中心のケアの統計的基盤でもあります。
平行線プロットで交互作用を「見る」
交互作用の有無を視覚的に確認する最もシンプルな方法が**平行線プロット(interaction plot)**です。
読み方
- 線が平行:交互作用なし。要因Aの効果は要因Bの水準に関わらず一定
- 線が交差・収束・発散:交互作用あり。要因Aの効果が要因Bの状態によって異なる
論文や学会では、以下のようなグラフで掲載されます。
交互作用がない場合は、改善度合いを示す線の傾きが同じ(線が平行)になります。

一方以下のように線が平行でないものは交互作用があると考えられます。線が平行でなければ、線の幅が右広がり/右すぼまり/交差など、どのパターンでも同様です。



注意点
平行線プロットはあくまで「目で見る」ツールです。線が少し傾いていても、それが統計的に意味のある交互作用かどうかは検定が必要です。次のセクションで扱います。
分散分析(ANOVA)での交互作用
二元配置ANOVAの構造
2つのカテゴリ変数(要因A・要因B)がある場合、二元配置ANOVAで交互作用を検討できます。
分散分析表の例
JASPなどの統計ソフトの出力や、論文での分析結果はこのように記載されます。
交互作用を見るときは、「*」や「×」で二つ以上の要素を並べて記載された項目です。
これが交互作用の検定をしている部分になります。以下の表でいえば「age ✻ reha_time」の部分です。非常に大まかにいえば、この値が0.05以下であれば交互作用があると考えます。
| 分散分析 – muscle_strength | |||||
| ケース | 平方和 | df | 平均平方 | F | p |
| age | 574.1 | 1 | 574.08 | 22.887 | 0.001 |
| reha_time | 374.1 | 1 | 374.08 | 14.914 | 0.005 |
| age ✻ reha_time | 234.1 | 1 | 234.08 | 9.332 | 0.016 |
| Residuals | 200.7 | 8 | 25.08 | ||
なお、この表では交互作用の検定は1行しかありませんが、データの構成によっては複数の行がある事もあります。
交互作用が有意だったとき
交互作用が有意な場合、主効果の解釈は慎重になる必要があります。「要因Aは全体として有意だが、要因Bの水準によって効果の大きさが異なる」という状況なので、主効果だけを報告するのは情報が不十分です。
このとき次に行うのが単純主効果検定です。
単純主効果とは:もう一方の要因をある特定の水準に固定したときの効果のことです。
先ほどの例でいえば、以下のような票が出力できます。
表を見ると若年層(young)はp=0.001ですが、高齢層(old)はp0.584です。
このような結果では、高齢者では長時間のリハの効果は薄そうだ、と判断できます。
| 単純主効果 – reha_time | |||||
| age 水準 | 平方和 | df | 平均平方 | F | p |
| old | 8.167 | 1 | 8.167 | 0.326 | 0.584 |
| young | 600 | 1 | 600 | 23.92 | 0.001 |
このように、交互作用が有意だった場合は「全体の平均効果」を見るのではなく、「どの群で効果があるのか」を単純主効果検定で確認します。
回帰分析での交互作用
ANOVAではカテゴリでの比較しかできませんが、回帰分析では連続変数をそのまま扱えるのが強みです。
1. カテゴリ×カテゴリ
2つのカテゴリ変数をダミー変数化し、さらに交互作用項を加えます。
| 短時間リハビリ | 長時間リハビリ | |
| 若年群 | 5 | 10 |
| 高齢群 | 2 | 4 |
なら、
- 若年効果 → 5-2=3
- 長時間リハ効果 → 4-2=+2
若年+長時間リハの効果は3+2=5になるはずです。
ここで実際の結果が上の表のように+10であれば、交互作用により5ポイント分の効果が上乗せされたといえます。
なので、
「若年と長時間リハビリが組み合わさると、単純加算以上の効果が出る」
つまり交互作用があったという判断になります。
なお、実質的にこれは二元配置分散分析のプロットと同じものです。
2. カテゴリ×連続変数
「グループごとに傾きが違う」状況です。
わかりやすい例でいうと以下のようになります。
年齢が若い群ではリハ時間を増やすと筋力が大きく改善していますが、高齢群では改善量の増え方が小さく(傾きが小さい)なっています。これも、年齢層によるリハ時間の効果の違いを示しています。

3. 連続変数×連続変数
両方が連続変数の場合、解釈がより複雑になります。
具体的な例としては、リハビリの時間は長いほうが筋力が上がりやすい。しかし、リハ時間延長の効果は年齢により異なる、といったケースが考えられます。
グラフにすると以下のようなものです(40,60,80歳を抜き出してグラフ化しています。)。

回帰曲面による可視化
上記の例では40歳・60歳・80歳の例しかグラフ化していませんが、これをすべての年齢について横に並べていくと回帰直線が並んだ曲面ができます。
交互作用がない場合は平面になり、交互作用がある場合は平面がねじれます。このねじれの程度が交互作用の大きさに対応しています。
スライダーを動かすと、対応した年齢の関係性(赤いライン)が強調表示されます。40歳と80歳を行き来すると、赤いラインの傾きが明らかに変化することがわかります。
グラフのほうはマウスで動かせるようになっています。
年齢が若いほど長時間リハで筋力回復が急激に増えていく、という関係性が見て取れるかと思います。
まとめ
この記事で扱った内容を整理します。
交互作用とは「ある要因の効果が、別の要因の水準によって変わること」で、臨床現場では日常的に起こりうる現象です。
分析の選択は変数の種類によって変わります。
| 変数の組み合わせ | 主な手法 | 可視化 |
| カテゴリ変数のみ | 二元配置ANOVA(回帰分析でも可) | 平行線プロット |
| 一つでも連続変数がある | 回帰分析 | グループ別回帰直線 |
解釈の際の注意点として、交互作用が有意なら主効果の解釈は慎重に、サブグループ解析は交互作用検定とセットで、検出力とサンプルサイズを意識する、の3点を覚えておいてください。
交互作用を適切に扱うことは、個々の患者に合った臨床判断の統計的根拠を作ることにつながります。
この記事が役に立ったと思ったら、ぜひシェアしていただけると嬉しいです。統計についてのご質問は[無料統計相談フォーム]からどうぞ。


コメント