Microsoft Excelで平均二乗誤差(MSE)を計算する方法



ExcelでMSEを計算する方法を理解するのは、少々面倒に感じることもありますが、モデルを比較したり、予測がどれだけうまくいっているのかを確認したりしたいときには、意外と役立ちます。理由はよく分かりませんが、数式のちょっとした調整が大きな違いを生むことがあります。特に、ページ上の数字ではなく実際のデータを扱う場合はなおさらです。また、設定によっては、これらの計算方法が最初からうまくいく場合もあれば、何度かやり直さなければならない場合もあります。Excelは、必要以上に計算を難しくしてしまうことがあるからです。

基本的に、予測の精度(例えば月間売上予測)を知りたい場合は、期待値と実際の値の平均二乗差を計算します。ここでMSE(平均二乗誤差)が役立ちます。MSEは、回帰直線やモデルが実際のデータにどれだけ近いかを評価するためによく使用されます。

数式自体は、合計、差の二乗、平均など、難しそうに見えるかもしれません。しかし、ステップバイステップで実行すれば、それほど難しくはありません。Excelで計算する方法を、手計算とクイック関数のどちらでどの程度複雑な計算をしたいかによって、主に2つの方法でご紹介します。

Excelで平均二乗誤差を計算する方法

方法1: SUMSQ関数を使用する(簡単)

これは最も早い方法ですが、セルの参照方法に注意しないとエラーが発生しやすくなります。実際の値と予測値の差を計算し、その差を二乗して合計し、観測値の総数(n)で割るという方法です。とても簡単です。

  1. 新しい列を作成します。ここでは、「差異」というラベルの付いた列 D とします。
  2. D2に「=C2-B2」と入力します(Cには実績値、Bには予測値が含まれたと仮定)。下にドラッグしてすべてのデータポイントを入力します。
  3. セルを選択して次のように入力します=SUMSQ(D2:D13)/COUNT(D2:D13)。D13 を最後の行に置き換え、範囲がデータと一致していることを確認します。

この数式は、差の二乗を合計し、合計数で割ることで、MSE(平均誤差)を算出します。ここで便利なのは、SUMSQ関数で二乗を計算するので、手動で二乗する必要はありません。範囲エラーや、すべてのデータを入力し忘れないように注意してください。

方法2: 手動で二乗して平均化する(より多くの制御、より多くの手順)

このアプローチはより透明性が高く、手動で差を二乗して平均を取ることができます。作業内容を再確認したり、トラブルシューティングをしたい場合に便利です。

  1. 列 D にすでに差異があると仮定して、列 E に「差異の 2 乗」というラベルを付けます。
  2. E2に「=D2^2」と入力します。すべての行を下にドラッグします。
  3. 空白のセルに「=AVERAGE(E2:E13)」と入力します。必要に応じて範囲を調整します。

これでも同じMSEが出力されます。正直なところ、デバッグ中や全てのステップを詳細に確認したい場合を除いて、最初の方法を使わない理由が分かりません。時々、差分が2乗されて表示されると安心することもあります。

いずれにせよ、設定によっては、これらの数式に多少の調整が必要になる場合があります。例えば、絶対参照を追加したり、データが移動した場合に範囲を修正したり、データの更新後に計算を再実行したりといった作業です。範囲が一致していることを確認してください。一致していないと、期待どおりではない奇妙な数値が返されます。

参考までに、Excelの統計機能は、これらの基本を習得すればかなり強力です。これで数時間の作業時間を短縮できるかもしれませんし、少なくとも予測誤差を評価する際に頭を悩ませる必要がなくなるかもしれません。頑張ってください。そして覚えておいてください。差異を目視で確認するだけで十分な場合もありますが、裏付けとなる数字があればなおさらです。

まとめ

  • 新しい列で実際のデータと予測データの差を計算します。
  • SUMSQ と COUNT を組み合わせて使用​​するか、手動で差を二乗して平均します。
  • エラーを避けるために、範囲と数式を再確認してください。

まとめ

ExcelでMSEを使うのは最初は少し面倒に感じるかもしれませんが、一度慣れてしまえば簡単です。モデルの精度を追跡する場合でも、予測に熱中する場合でも、これらの方法はきっと役立つはずです。数式をいじって結果を比較してみるだけで、すぐに慣れるでしょう。この方法がお役に立てば幸いです。分析を楽しんでください。



この記事は役に立ちましたか?