Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

MAPE(マープ)とは | 意味や読み方など丁寧でわかりやすい用語解説

MAPE(マープ)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

平均絶対パーセント誤差 (ヘイキンゼッタイパーセントゴサ)

英語表記

MAPE (マープ)

用語解説

MAPE(エムエーピーイー、Mean Absolute Percentage Error)は、予測モデルの精度を評価するためによく用いられる指標の一つである。システム開発やデータ分析の現場では、将来の需要、売上、在庫といったビジネス指標を予測する場面が多く存在する。このような予測がどれほど正確であったかを客観的に数値化し、モデルの性能を比較したり改善したりする際に、MAPEは非常に有用なツールとなる。その名の通り、「平均絶対パーセント誤差」を意味し、予測値が実績値から平均してどの程度のパーセンテージで乖離していたかを示す。

MAPEの計算は、まず個々のデータポイントにおける絶対パーセント誤差を求めることから始まる。具体的な計算式は以下の通りである。

絶対パーセント誤差 = | (実績値 - 予測値) / 実績値 | × 100%

ここで、「実績値」とは実際に観測された値であり、「予測値」とはモデルが出力した値である。分子の「(実績値 - 予測値)」は予測誤差であり、その絶対値を取ることで、予測が実績値よりも大きかったか小さかったかにかかわらず、誤差の大きさを正の値として扱う。この絶対誤差を実績値で割ることで、誤差が実績値に対してどの程度の割合(パーセンテージ)であったかを算出する。例えば、ある商品の実績販売数が100個で、予測販売数が110個だった場合、誤差は-10個だが、絶対誤差は10個となる。これを実績値100で割ると10/100=0.1、つまり10%の誤差となる。実績販売数が100個で予測販売数が90個だった場合も、絶対誤差は10個であるため、同様に10%の誤差となる。

この個々のデータポイントにおける絶対パーセント誤差を、全てのデータポイントについて算出し、それらの平均を取ったものがMAPEとなる。数学的に表現すると、データポイントがn個ある場合、MAPEは次のように計算される。

MAPE = (1/n) × Σ [ | (実績値i - 予測値i) / 実績値i | × 100% ] (Σはi=1からnまでの合計を意味する)

この計算により、予測の平均的なパーセンテージ誤差が得られる。MAPEの値が小さいほど、予測精度が高いと判断できる。

MAPEが多くの現場で利用されるのには、いくつかの明確な利点がある。

第一に、その直感的な理解しやすさである。MAPEはパーセンテージで表現されるため、「予測が平均してXパーセントずれていた」という結果は、専門家でなくとも容易に理解できる。これは、経営層やビジネス部門の担当者と予測モデルの性能について議論する際に非常に有効である。例えば、「このモデルのMAPEは10%です」と伝えることで、予測が平均して約1割程度の誤差を含んでいるという事実が、具体的なビジネスインパクトとして認識されやすくなる。

第二に、スケールフリー性がある。これは、MAPEがデータ単位の影響を受けないという特性を指す。例えば、数千万円単位の売上を予測する場合と、数個単位の在庫を予測する場合では、データのスケールが大きく異なる。しかし、MAPEは誤差をパーセンテージで評価するため、これらの異なるスケールの予測結果を直接比較することが可能である。MAE(Mean Absolute Error)やRMSE(Root Mean Squared Error)といった他の誤差指標はデータの単位に依存するため、異なるスケールのデータセット間での単純な比較は難しいが、MAPEであればそうした制約がない。この特性は、様々な種類の予測モデルを統一的な基準で評価したり、異なる地域や製品ラインにわたる予測パフォーマンスを比較したりする際に非常に役立つ。

一方で、MAPEにはいくつかの注意すべき限界も存在する。これらの限界を理解せずMAPEのみに依存すると、誤った評価につながる可能性がある。

最も重要な注意点の一つは、実績値がゼロ、またはゼロに近い場合に問題が生じることである。MAPEの計算式では実績値が分母となるため、実績値が0の場合にはゼロ除算が発生し、計算が不可能となる。また、実績値が0に極めて近い、例えば0.01のような非常に小さな正の値である場合でも、分子の誤差が小さくても分母が小さいために絶対パーセント誤差が極端に大きな値となり、MAPE全体が非常に不安定で非現実的な値を示すことがある。このため、需要がゼロになる期間や、ごく少量の取引しかないような品目の予測精度を評価する場合には、MAPEは適切な指標とは言えないことが多い。

次に、予測値と実績値の正負の扱いに関する問題がある。MAPEは主に売上、需要、在庫といった正の値を取るビジネス指標の予測に用いられる。しかし、もし予測対象が正負の両方を取り得る場合(例:利益や損失)、パーセンテージ誤差の解釈が複雑になる可能性がある。例えば、実績値が-10で予測値が-5の場合と、実績値が10で予測値が5の場合では、誤差の絶対値は同じでも、そのビジネス的な意味合いやパーセンテージとしての解釈が異なることがある。

また、MAPEは大きな誤差に対して敏感に反応する傾向がある。個々のデータポイントで非常に大きなパーセンテージ誤差が発生すると、それが平均値であるMAPE全体に強く影響を与え、実際の予測精度よりも悪く見えることがある。これは、個別の外れ値(異常値)の影響を受けやすいことを意味する。

さらに、MAPEは誤差の絶対値を用いるため、過大予測と過小予測の方向性を区別せず、同じ重みで評価する。ビジネスの文脈によっては、例えば在庫過剰(過大予測)よりも品切れ(過小予測)の方が重大な問題である、といったように、誤差の方向に非対称なコストが伴う場合がある。このようなケースでは、MAPEだけでは不十分であり、誤差の方向性も考慮できる他の指標やビジネス上の評価基準を併用する必要がある。

このような特性から、MAPEは特に以下のような場面で有効に活用される。需要予測や売上予測におけるモデルの精度評価、適正在庫量を維持するための予測モデルの性能評価、複数の予測モデルの比較による性能の優劣判断、予測モデルの改善目標設定(例: 「現在のMAPEを15%から10%に改善する」といった具体的な目標値の設定)、そして予測の精度をビジネスインパクトとして分かりやすく伝えるビジネス部門への報告などが挙げられる。

MAPEは、予測モデルの精度をパーセンテージで直感的に評価できる強力な指標であり、特にビジネス予測の分野で広く活用されている。そのスケールフリー性により、異なる性質の予測を統一的に比較できるという大きな利点を持つ。しかし、実績値がゼロまたはゼロに近い場合の不安定性や、誤差の方向性を考慮しないといった限界も理解しておく必要がある。システムエンジニアとしてデータ分析や予測モデルの開発に関わる際には、MAPEの持つ特性と限界を十分に認識し、他の評価指標(例:MAE、RMSEなど)やビジネス上の要件と組み合わせて多角的に予測精度を評価することが、より信頼性の高い意思決定を支援するために不可欠である。適切な指標の選択と解釈は、予測モデルを成功に導く鍵となるだろう。

関連コンテンツ