なぜ2020年ドラゴンズは、ピタゴラス勝率の予想よりも良い成績だったのか?

2020年12月5日

2020年のプロ野球シーズンが終わりました。今年は強いチームとそうでもないチームの差がはっきり出たように感じます。このウェブサイトで推しているプロ野球ペーパーオーナーゲームでもこの状況は再現できるのか?気になるので調べてみました。

プロ野球POGでの成績予測

プロ野球POGで使っている打者得点予想、投手失点予想、ピタゴラス勝率とリリーフによる勝率補正を使って12球団の成績を計算し、実際の成績と比較してみました。まずは得点と失点の比較から。

 

基本的にXRを使った得点、失点予測ですが、良い精度で予測できています。

この得点、失点予測からチーム勝率を予測した結果が次の図です。だいたい合っている・・・と言いたいところですが、ドラゴンズ、ライオンズなどはちょっとずれています。

現実の順位表とプロ野球POGの計算による順位表を比べると、トップと最下位くらいは合いますが、そのほかはあまり一致しませんでした(下表)。得点失点予測まではまずまず満足いく結果なのですが、勝率の予測で躓いた感じです。

しかしなぜ得失点差で60点もマイナスのドラゴンズが勝ち越せたのでしょうか?これは単なる偶然なのか、監督の采配なのか。

ピタゴラス勝率が実際の勝率と合わない原因

ドラゴンズのようなピタゴラス勝率と実際の勝率のずれが生じる原因について、単なる偶然や監督の采配ではなく、得点/失点の分布で説明できないだろうか、と考えてみました。

野球における得失点の確率分布

ところで野球における1試合あたりの得点はどんな確率分布をしているのでしょう?正規分布ではない、と思います。多分ですが、野球の得点(失点)分布は負の二項分布で近似できると思われます。負の二項分布は「ある確率で成功する事象が、決まった回数失敗するまでに成功する回数の分布」です(Wikipedia)。野球の得点も「9イニング27アウト取られるまでにホームに生還した回数」なので、似たようなものなんじゃない?・・・・厳密な証明などは私にゃ無理ですが、実際、2020年公式戦の結果全てを対象に得点の分布を描いてみると、負の二項分布で非常によく近似できます。

ということで、得点/失点の分布は多分負の二項分布で近似できだろうということにして、バファローズとドラゴンズの得失点分布を比べてみます。この2チームはかたや最下位、かたやAクラス入りですが、ピタゴラス勝率的には同じくらいの成績です。

頻度分布だけでは違いがわかりにくいですが、負の二項分布での近似を見ると両球団の傾向の違いがよくわかります。そして、この負の二項分布の近似を使って勝率を計算すると、次表のようになります。

  Bs
実際の勝率 0.398 0.522
ピタゴラス勝率 0.448 0.447
負の二項分布近似を使って計算した勝率 0.430 0.488

得点/失点分布を考慮した負の二項分布での勝率計算結果が、(分布を考慮しない)ピタゴラス勝率よりも実際の勝率に近い値を示しています。ピタゴラス勝率と実際の勝率の違いの一部は、得点/失点分布の違いでも説明できそうです。

失点分布の違いによる勝率の変化

平均的な得点能力(負の二項分布で平均4.1、分散8.9)の球団で、投手の失点分布が変わると、勝率がどう変わるのか計算してみます。失点の分布は、分散が変わると下図のように変化します。

分散(ばらつき)が大きくなると、完封することも多いけど、ぼろ負けの時も多いという感じです。

失点の平均と分散を変化させて、失点の平均-分散平面での勝率の等高線を描くと下図のようになります。その上に各球団投手陣の平均、分散の点をプロットしました。

 

ドラゴンズ投手陣の勝率が、平均防御率ではドラゴンズよりも低いタイガース、ベイスターズ、マリーンズよりも高いという結果になります。

同じチーム防御率なら、どんぐりの背比べな投手陣を揃えるより、1~2人の絶対的な先発エースがいるけど他はイマイチな投手陣の方が勝率が高いのではないかと思われます。いつも競った試合をするより、勝ち試合と負け試合をはっきりさせて、勝てるときに確実に勝つ、という方がチーム勝率がよくなるということですね。

という訳で、ピタゴラス勝率と実際の勝率とのずれは、監督の采配云々ではなく、投手陣の顔ぶれで決まる失点の確率分布も影響するんじゃないか、という話でした。

と、ここまで書いておいてなのですが、ドラゴンズの絶対的エース大野雄大の勝率は.529、全然勝てるときに勝っていない。ついでにライオンズの勝率が予想よりも高い理由は失点の分布では説明できない。・・・この理論はまだまだ穴だらけです。