私的セイバーメトリクス概論

2020年7月16日

プロ野球ペーパーオーナーゲーム 目次

ルール解説

 
 

セイバーメトリクスは「統計学を駆使して客観的に野球を分析すること」という、かなりざっくりした意味の言葉です。統計に基づいた大胆な守備シフトとか、フライボール革命などもセイバーメトリクスの範疇ですが、一番最初に注目され、よく知られているのは、選手の評価方法でしょう。

セイバーメトリクスが有名になるきっかけとなった小説マネー・ボール 奇跡のチームをつくった男では、アスレチックスのGM、ビリー・ビーンがセイバーメトリクスを駆使して他球団が見逃している「お買い得選手」を獲得し、資金力の劣る球団を強豪に仕立て上げます。

では、なぜ伝統的な指標に頼る他球団は「お買い得選手」を見つけられず、セイバーメトリクスでは見つけることができたのか?打率などの伝統的な指標が全く的外れだった訳ではありません。ただ評価の重みづけに問題があったのです。セイバーメトリクスが優れているのは、全てのプレーを(主観や印象によらず)公平に評価しているという点にあります。

本家ファンタジーベースボールでは、打率や本塁打などの伝統的な指標を使って架空球団の成績を計算しますが、プロ野球POGではセイバーメトリクスを使って計算します。わざわざこんなことをする理由は、セイバーメトリクスは様々な特技、個性をもつ選手を公平に評価するので、様々なタイプの選手がゲーム中で活躍できるようになるからです(このゲームを始めたのも、贔屓チームの全国的には有名でない隠れ優良選手を知人に知らしめたい、という理由からです)。

ここではプロ野球POGのルールの説明上必要な範囲でセイバーメトリクスの概要を説明します。セイバーメトリクスによる計算は基本的に勝てる野球の統計学――セイバーメトリクス (岩波科学ライブラリー)(鳥越規央 データスタジアム野球事業部 著)を参考にしていますが、ゲームなので正確さより面白さを優先しており、セイバーメトリクス的、数学的に正確でない内容が一部含まれることをお断りしておきます。

「得点価値」

セイバーメトリクスの基本の一つは、「すべてのプレーを得点価値に換算する」ことです。「得点」ではなく「得点価値」です。例えば四球では(押し出しを別として)直接得点は入りませんが、将来得点に繋がる可能性があるということで、「得点価値」があります。こんな計算が簡単にできる背景には、「試合の状況がアウトカウントとランナーの組み合わせ24種類に分類できる」という野球の特徴があります。得点価値の計算の基本となっているのが、次の表です。

表1 状況別得点期待値(出典:Wikipedia「Linear Weights」)

 なし一塁二塁三塁一二塁一三塁二三塁満塁
無死0.4800.8511.0751.3921.4591.7572.0092.253
一死0.2580.5230.7110.9530.9401.1851.3751.594
二死0.0990.2260.3330.3830.4540.4920.5910.749

状況別得点価値とは、「ある状況からイニングの終了までに入る得点の期待値」です。例えば表より、イニングの初めノーアウトランナーなしでは、イニング終了までに平均で0.480点入ります。各イニングは表の左上からスタートして、打席が進むたびに表の中を移動し(上方向には移動しない)、最終的に3アウト=得点期待値0になって終了します。この状況別得点価値を使って、様々なプレーの得点価値を次式で求めることができます。

(得点価値)=(得点)+(状況別得点価値の変化分)

いくつか計算例を示すと次表のようになります。

表2 状況別得点期待値を使った得点価値の計算例

プレーの例

一死走者なしで

二塁打を打った

一死二三塁で

二塁打を打った

一死一塁で6-4-3のダブルプレー

①打席前の得点期待値

0.258

1.375

0.523

②打席後の得点期待値

0.711

0.711

0.000

③得点の変化

0

2

0

プレーの価値③+②-①

0.453

1.336.

-0.523

このようにセイバーメトリクスでは、選手の全てのプレーを得点価値に換算し評価することで、公正に選手を評価するのです。

ゲームで使用する「平均値」について

本来セイバーメトリクスでは過去の全てのプレーでの得点価値を調べ、それを元に各プレーの「平均の」得点価値を求めて選手の評価に使います。しかしそんな真似は素人には無理なので、ゲーム上必要な得点価値の平均値を近似的に求める方法を考えます。まず、各状況の発生確率を、過去の結果から想定します。

表3 状況別発生確率(「勝てる野球の統計学」P.6の表を元に作成)

 

なし

一塁

二塁

三塁

一二塁

一三塁

二三塁

満塁

無死

23.6%

6.0%

1.5%

0.2%

1.3%

0.5%

0.3%

0.3%

一死

16.9%

6.6%

3.6%

0.9%

2.5%

1.2%

0.9%

1.0%

二死

13.3%

6.7%

4.1%

1.6%

3.2%

1.7%

1.0%

1.3%

もしも、各プレーの発生確率が状況によらないならば、表1と表3から様々なプレーの「平均の」得点価値を求めることができるはずです。単打、二塁打、併殺打などはプレー後の状況が何通りか考えられますが、四球、三塁打、ホームランなどはプレー後の状況がほぼ一つに決まるので、簡単に得点価値を計算できます。例えば2004~2013年NPBを対象にしたホームランの平均得点価値は1.42(鳥越規央著「勝てる野球の統計学」P.12)ですが、ホームランの発生確率は状況によらないと仮定すると表1と表3を使って次式により得点価値が計算できます。

\((ホームランの得点価値)=\sum_{状況}{(走者数+1ー得点価値+走者なしの得点価値)}・{(発生確率)}\)

計算した得点価値は1.43となり、ほぼ同じになります。正確な証明ではないですが「プレーの発生確率は状況によらない」という仮定はとりあえず尤もらしいということで、ゲーム上はこの仮定を用いて各種計算を行います。

プロ野球ペーパーオーナーゲーム 目次

ルール解説