時系列予測の基本モデルであるARMAモデルを拡張した「SARIMAXモデル」。医療やリハビリの現場でも活用できる予測手法のひとつですが、「なんだか難しそう」と感じる方も多いかもしれません。
この記事では、統計に詳しくない方でも理解できるように、SARIMAXモデルの基本から活用例までをやさしく解説します。
「基本のARMAモデルから知りたい!」という方は、こちらの記事もご覧ください。
SARIMAXモデルとは?
SARIMAXモデルは、ARMAモデルをベースに、現実の“非定常”な時系列データにも対応できるよう拡張された予測モデルです。
モデル名「SARIMAX」に含まれる「S」「I」「X」は、それぞれ以下のような要素を表しています:
要素 | 意味 | 説明 |
---|---|---|
S | Seasonal(季節成分) | データに周期性がある場合に対応します。 |
I | Integrated(トレンド成分) | 差分を取ることで、持続的な増加や減少の傾向を取り除きます。 |
X | eXogenous(外生変数) | 天候・イベント・施策など、外部の影響を取り入れます。 |
このようにSARIMAXモデルは、単なるARMAモデルでは扱いにくい「トレンド」「周期性」「外的要因」などを含むデータにも対応できる、非常に柔軟性の高いモデルです。
要素ごとの具体例と考え方
ここでは、S・I・Xそれぞれの要素がどんな場面で意味を持つのか、医療やリハビリの現場での実例を交えて紹介します。
ベースのモデル(ARMAモデル)
- 意味:ベースとなるモデル。データは上下に動くが動きの幅は概ね一定で、上がり続けたり周期的に変動したりしない、という前提のモデル。
- グラフにすると下のような感じ

S(季節成分)
- 意味:周期的な変動を捉える
- 例:
- インフルエンザの感染者数(冬に増加)
- 手指消毒液の使用量(年末年始に多くなる)
- 注意点:
- 周期性は「一定の間隔」で繰り返す必要があります。
- 異なる周期(例:年単位+月単位)が重なると、モデル化が難しくなることもあります。
- グラフにすると下のような感じ

I(トレンド成分)
- 意味:長期的な増加・減少傾向を取り除く
- 例:
- 入院患者数の漸減傾向
- リハビリ患者のADLスコアが時間とともに改善していく
- 注意点:
- 傾向は一定ペースで変化している必要があります。
- 増加から減少に反転するなど、非線形な動きはうまく扱えない場合があります。
- グラフにすると下のような感じ

X(外生変数)
- 意味:外部からの影響(イベントや施策)を取り入れる
- 例:
- 健康診断やインフルエンザ流行などのイベント
- 新しい治療法の導入、スタッフ体制の変更など
- 注意点:
- 外生変数は、予測時にもその内容が把握できる必要があります。
- 予測に使えない変数(例:未来のイベント詳細が不明)を含めると、精度が不安定になることがあります。
- グラフにすると下のような感じ

SARIMAXモデル
- 意味:上の全ての要素を足したもの。周期性 + トレンド + イベントによる変動
- グラフにすると下のような感じ

SARIMAXはあくまで拡張:ARIMAやSARIMAとしての利用も可能
SARIMAXモデルは、必要に応じて要素を「加えたり引いたり」して使える柔軟な設計になっています。
モデル名 | 含まれる要素 | 対応できるデータの特徴 |
---|---|---|
ARMA | AR + MA | トレンドや周期性がないデータ向け |
ARIMA | AR + I + MA | トレンド(増減傾向)があるデータ向け |
SARIMA | AR + I + MA + S | トレンド+周期性があるデータ向け |
SARIMAX | AR + I + MA + S + X | 上記に加えて、外部要因の影響も考慮 |
たとえば「トレンドはあるけれど季節性はない」「外的要因は気にしなくてよい」など、分析対象のデータに応じてモデルの構成をシンプルにすることが可能です。
モデルを使う前に確認しておくべきポイント
SARIMAXモデルは強力ですが、どんなデータにも使えるわけではありません。以下の点を事前にチェックしておきましょう:
- データは一定間隔で記録されているか?
欠測や記録間隔のばらつきがあると、予測が不安定になります。 - 十分なデータ量があるか?
たとえば年単位の傾向を予測したいのに、データが半年分しかないと精度が出ません。 - 外生変数は予測時にも把握できるか?
将来の予測に使えない変数(例:来年のイベント内容)を含めても、予測には役立ちません。
医療・リハビリ現場での活用例
SARIMAXモデルは、医療や介護の現場でも次のように活用できます:
- 入院患者数の予測
月ごとの患者数トレンド+季節要因(冬に多いなど) - 在庫管理の最適化
マスクや手指消毒液など、消耗品の使用パターンの予測 - 歩行データの時系列分析
ウェアラブルセンサーから得られる歩行データの周期性・傾向のモデル化
まとめ
SARIMAXモデルは、トレンド・季節性・外的要因など、現実の複雑な時系列データに対応できる柔軟で強力な手法です。
これまでARMAモデルでは扱えなかった現象も、S・I・Xの要素を加えることでより実践的な予測が可能になります。リハビリや病院運営の改善に向けて、こうした時系列モデルを少しずつ取り入れてみてはいかがでしょうか?
コメント