はじめに
「サンプルサイズが30例あればt検定が使える」——臨床研究や卒業論文の指導でこんな話を聞いたことはありませんか?
でも、よく考えると不思議ではないでしょうか。t検定は「データが正規分布に従っている」ことを前提にした検定です。ところが現実の臨床データは、FIMスコアのように天井・床効果のある分布や、入院日数のように右に歪んだ分布など、正規分布とはほど遠いものが少なくありません。それでもなぜ「30例あれば大丈夫」と言われるのでしょうか。
その答えが**中心極限定理(Central Limit Theorem:CLT)**です。
この記事では、中心極限定理の意味と重要性を言葉で解説したうえで、インタラクティブなシミュレーターで実際に体感してもらいます。数式はほとんど使いません。「なんとなく知っていたけど、実はよくわかっていなかった」という方にも理解できるよう書きました。
中心極限定理とは何か
中心極限定理を一言で言うと、こうなります。
母集団の分布がどんな形であっても、そこから繰り返しサンプリングした標本平均の集団は、サンプリングを繰り返すにつれて正規分布に近づく。
少し噛み砕いて説明します。
たとえば、ある病院の入院患者全員のリハビリ所要時間を考えてみましょう。この「全患者」が母集団です。所要時間のデータは右に歪んでいて、とても正規分布には見えないかもしれません。
ここで、この母集団から30人を無作為に選んで平均値を計算します。これが「標本平均」です。次に、また別の30人を選んで平均値を計算します。これを何百回、何千回と繰り返すと——集めた標本平均の集合は、正規分布の形に近づいていきます。
元のデータ(所要時間)が正規分布でなくても、です。これが中心極限定理の主張です。
なぜ中心極限定理が重要なのか
データが厳密に正規分布でなくてもよくなる――検定の頑健性を支えている
医療分野で利用される分析手法の大部分は正規分布を前提としています。しかし臨床で扱うデータは、厳密に正規分布になることはほとんどありません。FIMやMMSEのような評価スコア、BMI、Alb・HbA1cなどの生体指標は、天井効果・床効果や指標の算出方法によって、完全な左右対称の釣り鐘型にはなりません。
中心極限定理があるおかげで、これらのデータも「元のデータが厳密に正規分布でなくても、サンプルサイズが十分であれば標本平均は正規分布に近づく」ため、t検定や回帰分析などの正規分布をベースとした解析手法で実用上使えるようになります。
この「前提が多少崩れても結果が大きく歪まない耐性」のことを、統計では頑健性と呼びます。
※頑健性の高さは検定手法によって異なります。t検定は比較的頑健な手法のひとつですが、すべての検定がサンプルサイズさえ確保すれば使えるわけではあ
りません。
平均値などの点推定・区間推定も楽になる
中心極限定理の恩恵は検定の選択にとどまりません。
標本平均そのものが母平均の推定値(点推定)として使えるのも、標本平均の分布が正規分布に従うことが保証されているからです。
また、母平均の区間推定——つまり信頼区間の計算も、標本平均が正規分布に近づくことを前提として成り立っています。
「この治療群の平均改善量は◯点で、95%信頼区間は△〜□点だった」という記述は、元データの分布がどんな形であれ、サンプルサイズが確保されていれば中心極限定理を根拠に計算できます。つまり、検定だけでなく推定の枠組み全体を支えているのが中心極限定理です。
もし中心極限定理がなかったら
この便利な中心極限定理がなかったらどうなってしまうのでしょうか?
中心極限定理が存在しない世界では、統計検定をするたびに母集団の分布を厳密に調べなければなりません。
「このデータは本当に正規分布に従っているか?」「もし正規分布でなければ、どの検定を使えばいいのか?」——臨床研究の現場では母集団の真の分布はほとんどわかりません。そのたびに大規模な予備調査が必要になるか、あるいは多くの研究が「分布の仮定が確認できないため検定不能」という状況に陥ってしまうでしょう。
中心極限定理があるおかげで、「サンプルサイズさえ確保すれば、分布の仮定を毎回厳密に検証しなくても平均値で議論できる」という、現代統計学の実用性が成り立っています。
シミュレーター①:収束の速さを体感する
ここで実際にシミュレーターを動かしてみましょう。
このシミュレーターでは、正規分布の母集団(平均50、標準偏差10)からサンプリングを繰り返します。n=10とn=100を切り替えることで、サンプルサイズによって収束の速さがどう変わるかを確認できます。
母集団のグラフと標本平均のグラフは、あえて同じX軸スケールで表示しています。サンプルサイズが大きくなると、標本平均の分布が母集団より鋭く絞り込まれていく様子に注目してください。
確認してみましょう: n=10とn=100で、標本平均の分布の「広がり」はどう変わりましたか?
シミュレーターから読み取れること
n=10のときと比べて、n=100では標本平均の分布が平均値付近に集中したはずです。これはSE = σ/√nの式そのものです。n=10ではSEは約3.16、n=100ではSEは約1.0になります。サンプルサイズを10倍にしても標準誤差は√10倍(約3.16倍)しか改善しない——この「収穫逓減」は臨床研究のサンプルサイズ設計でも重要な考え方です。
シミュレーター②:どんな分布でも成り立つ
次のシミュレーターでは、正規分布以外の4種類の母集団を選べます。
- 右歪み分布(指数分布):入院日数や反応時間のような、右に長い尾を持つ分布
- 左歪み分布(ベータ分布):天井効果のあるスコアデータに似た分布
- 二峰性分布(混合分布):2つの異なる集団が混在するような、ふたこぶの分布
- 一様分布:すべての値が等確率で出現するフラットな分布
それぞれの分布で100回サンプリングを実行して、標本平均の分布を確認してみてください。
確認してみましょう: 二峰性分布のような極端な形の分布でも、標本平均は正規分布に近づきましたか?
シミュレーターから読み取れること
どの分布を選んでも、100回の試行後には標本平均が正規分布の形に収束していったはずです。これが中心極限定理の核心です。
ただし、一点注意が必要です。右歪み分布(指数分布)のように歪みが強い分布では、正規分布への収束が他より遅くなります。このシミュレーターではn=30で固定していますが、歪みが強い分布ほど「十分な収束」に必要なサンプルサイズが大きくなります。
直感的なイメージ
なぜこのようなことが起きるのでしょうか。数式なしで直感的に説明します。
平均を取るという操作は、「ばらつきをキャンセルする」操作です。たまたま大きな値を引いた人がいても、たまたま小さな値を引いた人がいれば、平均を取ることで互いに打ち消し合います。サンプルサイズが大きくなるほど、この打ち消し合いが多く起きるので、極端な平均値が出にくくなります。
言い換えると、「真の平均からほど遠い標本平均」は実現しにくく、「真の平均に近い標本平均」が実現しやすい——この非対称性が積み重なることで、左右対称の釣り鐘型が自然に現れてきます。
こうして「極端に大きい平均値も極端に小さい平均値も出にくく、真の平均付近に集まりやすい」という、左右対称で釣り鐘型の分布——正規分布——が自然に生まれてくるのです。
中心極限定理が成り立つための前提条件
中心極限定理は万能ではありません。成り立つためには以下の条件が必要です。
① データが互いに独立である 各データが他のデータと独立に得られていることが必要です。同一患者からの繰り返し測定や、家族内のデータなど、データ間に依存関係がある場合は成立しません。
② サンプルサイズが十分に大きい 「十分に大きい」の目安としてよく挙げられるのがn=30ですが、これは目安に過ぎません。母集団の分布の歪みが強いほど、より大きなサンプルサイズが必要になります。
③ 母集団の平均と分散が存在する 極めてまれなケースですが、平均や分散が定義できない分布(例:コーシー分布)では中心極限定理は成立しません。通常の臨床データでこれが問題になることはほとんどありませんが、理論上の前提として知っておくとよいでしょう。
よくある誤解
❌「n=30あればどんな分布でもt検定できる」
n=30という数字はあくまで目安であり、保証ではありません。分布の歪みが強い場合や外れ値が含まれる場合は、n=30では標本平均の分布が十分に正規分布に収束していないことがあります。
たとえばFIMスコアのような天井・床効果のある順序尺度データや偏りが強いデータでは、もっと多くのサンプル数が必要になることもあります。
❌「中心極限定理があるから元のデータも正規分布になる」
中心極限定理が保証するのは「標本平均の分布」が正規分布に近づくことであって、元のデータ(個々の観測値)が正規分布になるわけではありません。元データの分布はどこまでいっても元の形のままです。
❌「CLTがあるから正規性の検定は必要ない」
中心極限定理はt検定の頑健性を支えていますが、正規性の確認が不要になるわけではありません。特にサンプルサイズが小さい場合や、使う統計手法によっては正規性の仮定が重要な場合があります。検定の前提条件は、手法ごとに確認することが基本です。
まとめ
- 中心極限定理は「母集団の分布がどんな形でも、標本平均はサンプルサイズが大きくなるにつれて正規分布に近づく」という定理です。
- この定理があるおかげで、t検定などの正規分布を前提とした検定が、分布によらず実用的に使えるようになります。
- ただし「n=30あれば万能」ではなく、分布の歪みや外れ値の有無によって必要なサンプルサイズは変わります。
- 中心極限定理が保証するのは「標本平均の分布」であり、元のデータが正規分布になるわけではありません。
統計的推論の多くは、この中心極限定理を暗黙の前提として成り立っています。「なんとなく使っていた」検定の背景に、こういった理論的な根拠があることを知っておくと、データを扱うときの視点が少し変わってくるかもしれません。
中心極限定理に関連する記事
t検定とは?わかりやすく解説
95%信頼区間とは?わかりやすく解説
標準偏差とは?分散と対比して解説
標準誤差とは?標準偏差と対比して解説


コメント