ベイズ統計とは？頻度主義との違いをわかりやすく解説【医療従事者向け入門】

はじめに
頻度主義とベイズ主義：二つの流派をざっくり整理
1. 頻度主義の発想：「この方法はどれだけ信頼できるか？」
2. ベイズ主義の発想：「今ある情報でもっともらしい答えを更新していこう」
ベイズ統計ってどんなもの？
ベイズ統計のメリット
デメリットと、それへの向き合い方
1. 計算が大変
2. 事前分布に主観が混ざる可能性がある
まとめ
ベイズ統計に関連する記事

はじめに

「統計解析といえばp値」——医療系の養成校で統計を学んだ方なら、そう感じているかもしれません。論文を読むときも、研究発表を聞くときも、登場するのはほぼ必ずp値と信頼区間。統計＝頻度主義の手法、というのが医療現場での常識になっています。

しかし実は、統計の世界には大きく分けて二つの流派があります。

ひとつは、今まさに医療系の教育や論文で主流となっている頻度主義統計。もうひとつが、近年じわじわと医療研究の場でも存在感を増しているベイズ統計です。

実際、ここ数年でベイズ統計を用いた医療系論文の数は増加しており、特に臨床試験や疫学研究の分野でその名前を目にする機会が増えてきました。「ベイズ」という言葉を論文で見かけたことがある方も多いのではないでしょうか。

この記事では、「ベイズ統計って何？」「頻度主義と何が違うの？」という疑問に答えながら、ベイズ統計の考え方と、医療研究との相性の良さをわかりやすく解説していきます。数式は使いません。まずはざっくりとした「発想の違い」をつかんでもらうことを目標にします。

頻度主義とベイズ主義：二つの流派をざっくり整理

まず、二つの流派がそれぞれどんな「ものの見方」をしているのかを整理しておきましょう。

頻度主義の発想：「この方法はどれだけ信頼できるか？」

頻度主義統計の根本にある問いは、「この推測の方法は、長い目で見てどれくらい正しい答えを出してくれるか？」というものです。

p値を例に取ると、p＜0.05という結果は「この治療に効果がある確率が95%以上」を意味するわけではありません。正確には「もし本当に効果がないとしたら、今回のような極端なデータが得られる確率が5%未満だった」という意味です。

ここが頻度主義のわかりにくいところで、実は多くの医療従事者（研究者も含めて）がp値を「仮説が正しい確率」と誤解しています。頻度主義は「仮説の正しさ」を直接評価するのではなく、「推測の手続きの信頼性」を評価する考え方なのです。

ベイズ主義の発想：「今ある情報でもっともらしい答えを更新していこう」

一方、ベイズ主義の根本にある問いは全く異なります。「今手に入っている情報を使って、もっともらしい仮説はどれか？そしてデータが増えたら、その考えをどう更新すべきか？」というものです。

ベイズ統計では、「この治療が有効である確率は72%」という形で、仮説の確からしさを直接確率として表現します。これは頻度主義では原理的にできないことで、ベイズ統計の大きな特徴のひとつです。

二つの違いを一言で表すなら、こうなります。

	頻度主義	ベイズ主義
核心の問い	この手法はどれだけ信頼できるか	この仮説はどれだけ確からしいか
p値・結果の意味	手法の長期的な正確さ	仮説が正しい確率
データの扱い	データから手法を評価する	データで信念を更新する
直感との一致	ズレが生じやすい	比較的一致しやすい

ベイズ統計ってどんなもの？

意外と古い歴史がある

「ベイズ統計」という名前は、18世紀のイギリスの牧師・数学者トーマス・ベイズに由来します。彼が1763年（没後）に発表した論文の中で示したアイデアが、現代のベイズ統計の出発点になっています。

ただし、長い間ベイズ統計は「計算が現実的でない」という壁に阻まれ、頻度主義の陰に隠れた存在でした。ベイズ統計の計算には膨大な数値計算が必要で、コンピューターが普及する以前は実用的な手法として広まりにくかったのです。

状況が変わったのは1990年代以降です。マルコフ連鎖モンテカルロ法（MCMC）と呼ばれる計算アルゴリズムが実用化され、コンピューターの性能が飛躍的に向上したことで、複雑なベイズ計算が現実的な時間で行えるようになりました。さらにStan・PyMC・BRMSといった専用ソフトウェアの整備が進み、「計算できる人が限られた特殊な手法」から「使おうと思えば使える手法」へと変わってきました。

ベイズ統計の核心的な発想

ベイズ統計の発想を一言で表すなら、**「情報を順番に積み重ねて、考えを更新していく」**プロセスです。

少し具体的に考えてみましょう。

あなたは今、新しい痛み止めの効果を評価しようとしています。研究を始める前の時点で、過去の類似薬のデータから「おそらくそこそこ効くのではないか」という見通し（これを事前情報といいます）があります。

そこに実際の臨床データが加わります。データが「かなり効果が出た」という結果を示していれば、最初の見通しはより強く「効果がある」方向に更新されます。逆にデータが「あまり効果が見られなかった」なら、見通しは「効果は小さいかもしれない」方向に引き戻されます。

理解を深めるため、動かせるグラフで感覚をつかんでみましょう。
👇このグラフはボタンをクリック（タップ）することで、グラフが更新されていきます。

この「事前の見通し＋新しいデータ＝更新された推測」という構造がベイズ統計の核心です。データが増えるほど推測は精度よく絞り込まれ、最終的には事前の見通しの影響が小さくなっていきます。

この発想は、私たちが日常的に行っている「経験をもとに判断を更新する」という思考プロセスと非常に近く、直感的に理解しやすいという特徴があります。

なぜ今ベイズが注目されているのか

ベイズ統計が医療研究で注目されるようになった背景には、大きく三つの理由があります。

一つ目は、先述の通り計算環境の整備です。以前は一部の専門家しか扱えなかった手法が、現在は医療統計の知識がある研究者であれば比較的使いやすい環境が整ってきました。

二つ目は、医療研究特有の課題との相性の良さです。希少疾患の研究では症例数が少ない、リハビリテーション研究では個人差が大きい、縦断的なデータを扱う必要がある——こうした医療現場ならではの難しさに、ベイズ統計は柔軟に対応できます。

三つ目は、頻度主義統計の限界への気づきです。p値の誤解や、「p＜0.05かどうかだけで判断する」という慣習への批判が国際的に高まる中、別のアプローチとしてベイズ統計への関心が高まっています。

ベイズ統計のメリット

結果が直感的にわかりやすい

ベイズ統計の最も大きなメリットのひとつが、結果の表現の直感的なわかりやすさです。

頻度主義では「p＝0.03、よって統計的に有意」という形でしか結論を言えません。この結果が「治療が有効である確率」を直接示しているわけではない、ということはすでに述べた通りです。

一方、ベイズ統計では「この治療が臨床的に有意義な効果を持つ確率は87%」という形で、知りたいことをそのまま確率として表現することができます。この表現は医師・患者・研究者のいずれにとっても理解しやすく、エビデンスを臨床判断に結びつけやすいという利点があります。

検定の非対称性が少ない：ベイズファクターという指標

頻度主義の統計検定には、構造的な非対称性があります。「効果がある（帰無仮説を棄却する）」という結論は出せますが、「効果がない」ということを積極的に示す手段がありません。「有意差が出なかった＝効果がない」とは言えないのです。

これは臨床的に「効果がないことを示したい」場面——たとえばある治療が副作用を増やさないことや、ジェネリック薬が先発薬と同等であることを示す非劣性試験——では大きな問題になります。

ベイズ統計にはベイズファクターという指標があります。これは「効果があるという仮説」と「効果がないという仮説」のどちらがデータによってどれだけ支持されているかを、対等に比較できる指標です。「効果がある証拠」と「効果がない証拠」を同じ土俵で評価できるため、頻度主義の検定が持つ非対称性を避けることができます。

事前情報を組み込める

医療研究において「まったくの白紙から研究を始める」ことは実はほとんどありません。先行研究の結果、臨床経験から得た知見、既存のメタ分析のデータ——研究を始める前から、何らかの情報は必ずあります。

ベイズ統計では、こうした事前情報を「事前分布」として数値化し、分析に組み込むことができます。これは特に症例数が少ない研究で大きな強みになります。希少疾患の研究や、リハビリテーション分野の小規模介入研究など、十分なサンプルサイズを確保しにくい状況でも、既存の知識を活かした推定が可能になります。

柔軟なモデリングが可能

実際の臨床データは、教科書通りに綺麗な形をしていることはほとんどありません。欠損データ、個人間の大きなばらつき、非線形の関係、時系列に沿った変化——こうした複雑な構造を持つデータにも、ベイズ統計は柔軟に対応できます。

階層モデルや混合モデルといった複雑なモデルも、ベイズの枠組みでは比較的自然に扱うことができ、医療データの「現実の複雑さ」を素直に反映した分析が可能です。

デメリットと、それへの向き合い方

公平に評価するために、ベイズ統計のデメリットもきちんと取り上げます。

計算が大変

ベイズ統計の計算は、頻度主義の検定のように「公式に数値を当てはめれば終わり」というものではありません。MCMCという数値計算アルゴリズムを使って、コンピューターが大量の計算を繰り返すプロセスが必要です。

ただし、現在はJASPというフリーソフトを使えばGUI（画面上のクリック操作）でベイズ統計を実行することができます。Rを使えるなら、BRMSやrstanarmといったパッケージが整備されており、実行のハードルは以前と比べて格段に下がっています。

「計算が大変」というデメリットは確かに存在しますが、ツールの進化によって以前ほどの障壁ではなくなってきている、というのが現状です。

事前分布に主観が混ざる可能性がある

これがベイズ統計への最大の批判です。「事前分布の設定が恣意的になりうる」、つまり「分析者が望む結果に誘導できてしまうのではないか」という懸念です。

この批判は正当な側面を持っています。事前分布の設定次第で結果が変わる可能性があることは事実です。

ただし、いくつかの反論も重要です。

まず、無情報事前分布や弱情報事前分布という選択肢があります。事前情報をほとんど持ち込まず、データに語らせることを優先する設定で、主観の影響を最小限に抑えることができます。

次に、頻度主義も主観から無縁ではありません。有意水準をp＜0.05に設定することも、サンプルサイズの決め方も、検定手法の選択も、すべて研究者の判断が入っています。「主観が混ざるのはベイズだけ」ではないのです。

そして重要なのは透明性の問題です。ベイズ統計では事前分布を論文中に明示することが求められるため、「どんな事前情報を使ったか」が読者に見える形になります。これはむしろ再現性や透明性の向上につながるという見方もできます。

まとめ

この記事でお伝えしたことを整理します。

統計には頻度主義とベイズ主義という二つの考え方がある
頻度主義は「推測手法の信頼性」を評価するのに対し、ベイズ主義は「仮説の確からしさ」を直接確率として扱う
ベイズ統計は18世紀から存在するが、計算環境の整備により近年実用的に使えるようになってきた
ベイズ統計の核心は「事前情報＋新しいデータ＝更新された推測」というサイクル
直感的な結果表現、検定の非対称性の少なさ、事前情報の活用、柔軟なモデリングという点で医療研究との相性が良い
計算コストと事前分布の主観性というデメリットはあるが、ツールの整備と適切な対処法で対応できる

こんどう

【著者について】

理学療法士（回復期リハビリ病棟 12年以上）

統計検定2級・Python 3エンジニア認定（データ分析）取得。
臨床現場でのデータ活用を目的に統計・機械学習を独学。
FIM退院予測モデルを個人で設計・実装（スタッキングアンサンブル＋SHAP）。
強化学習（MuJoCo/Walker2d）や高位頸髄損傷患者向けデバイスの
自作など、臨床課題を技術で解くことに関心を持つ。

医療職向けに統計・データサイエンスをわかりやすく解説するブログ
「Curiosity Creates」を運営中。