データサイエンス

データサイエンス

MAEやAccuracyだけでAIを信用するのは危険!医療AI予測モデル導入前に確認すべきこと

はじめに 以前の記事で、回帰モデルや分類モデルの評価指標として、MSE(平均平方法誤差)・MAE(平均絶対誤差)やAccuracy(正解率)、ROC-AUCなどの指標をご紹介しました。 しかし、これらの数値だけで「この予測モデ...
データサイエンス

【注意】AccuracyやROC曲線だけでは不十分?医療現場で使える分類モデル評価指標を図解で解説

【医療現場にも役立つ】分類モデルの評価指標をやさしく解説 近年、医療の世界でも「機械学習」や「予測モデル」の活用が注目されています。たとえば、患者の転倒リスク、疾患のスクリーニング、退院時の自立度などを予測するモデルが登場し、学会や...
データサイエンス

【コード量とUIデザインで比較】Streamlit vs Tkinter:機械学習GUIアプリ開発はどっちがベスト?

機械学習モデルを「使える」形に!Streamlitでアプリ化のススメ モデルを構築し、素晴らしい予測性能を達成したとき、次に考えるのは「このモデルをどうやってみんなに使ってもらうか?」ではないでしょうか。 以前の記事では、機械...
データサイエンス

MAE・MSEの違いと使い分けを図解で解説|回帰モデルの評価指標まとめ【初心者向け】

機械学習やディープラーニングを利用した予測モデルの利用が一般的になってきています。売り上げ予測や在庫管理など、将来が高精度に予測できると良い場面はたくさんあります。医療分野でも、近年は予測モデルを活用する場面が増えてきました。学会やジャー...
データサイエンス

LightGBM・XGBoost・CatBoostを比較!回帰タスクで勾配ブースティング3モデルの精度を検証

はじめに Kaggleなどの機械学習コンペでは、決定木ベースのブースティング手法やディープラーニングがよく使われている印象があります。しかし、私自身は CatBoost や XGBoost をこれまで使ったことがなく、「実際どんな...
データサイエンス

ディープラーニングと機械学習の使う上での違いとは?数値データ・画像データでの使い分けについて易しく解説

この記事のテーマ 以前の記事はディープラーニングと機械学習の一つである回帰分析の精度の違いについて紹介しました。ディープラーニングと回帰分析だと条件によって精度に大きな差が出ていました。 しかし、実のところエクセルで処理するよ...
データサイエンス

クリック操作だけでAI予測!かんたんアプリをPythonで作ってみた話

背景:せっかく作ったモデル、誰が使うの? データサイエンスや機械学習のモデルを作ったはいいけど、こんな状況になったりします。 「このモデル、Pythonが使える人しか動かせなくない?」 頑張って集めたデータを前処理し...
データサイエンス

【失敗談】標準化を忘れてディープラーニングの学習が鈍かった話|なぜ標準化が必要なのか?

はじめに 先日、リハビリ予後予測をテーマにしたディープラーニングモデルを作成している際、「データの標準化(Standardization)」を忘れて実行してしまいました。 その結果、モデルの精度がなかなか上がらず、エポック数を...
データサイエンス

バイアスとバリアンスの意味が分野で違い戸惑った話【医療・統計・データサイエンス】

最近、機械学習の勉強をしている中で、「バイアス」「バリアンス」という用語に出会いました。聞いたことのある言葉だな、と思ったものの、どうも文脈が違います。 医療、統計、機械学習。勉強する分野が広がるにつれて、同じ言葉でも意味が変わるこ...
機械学習

LightGBMと重回帰、回帰精度が高いのはどっち?サンプル数ごとの精度を可視化して比較検証

前回の記事では、ランダムフォレストと重回帰分析の予測精度をサンプル数ごとに比較しました。今回は、LightGBMと重回帰分析の比較結果をご紹介します。特に医療データ分析に携わる方にとって、**「どのモデルを選ぶべきか」**の参考になれば幸...
タイトルとURLをコピーしました