Lions Data Lab

選手レビューや、一風変わったデータ分析の発信を目指しています

奪三振率だけでは測れない?本当の奪三振力

 こんにちは、Datalab管理人です。

 

 「堅苦しくないデータ検証ブログ」を目指していますが、なんか名乗っていてすでに堅苦しいので、親しみやすいハンドルネーム考えた方がいいですかね…。

 

 まぁ本編はそうならないように注意して書いていきますので、お時間ある方はどうぞお付き合いくださいませ。

 

 本稿の目次は下記の通りです。

 

 

 では早速、本題に。

 

奪三振の能力を測る指標

f:id:Lions_Datalab:20210112002752p:plain

 

 今回はタイトルの通り、「奪三振力」をテーマに考察したいと思います。

 

 みなさんは、三振を奪う能力を表す指標と問われたら、何をイメージされるでしょうか?

 

 セイバーメトリクスが普及した現代においては、色々と専門的な指標があるのでしょうが、既存のものでは「奪三振率」がわかりやすく、有名ですよね。少なくとも自分はそれしか知りません…。

 

 その定義は、下記の通りです。

 

\displaystyle{奪三振率= 奪三振数 \times \frac{9}{投球回数}}

 

 つまり、「一人の投手が9イニング投げた場合にどれだけ三振を奪えるか」を仮想的に示した数値となっております。奪三振率よりも、MLBの表記であるK/9の方が正確な表現なのかもしれません。一般的には、9を超える、すなわち1イニングあたり1つ以上の三振を奪える投手は奪三振能力が高いと評されている気がします。

 

 2020年シーズンにおける、パリーグ主力投手の奪三振*1は下記の通りです。数字が細かいので、必要であれば拡大してご覧ください。

 

f:id:Lions_Datalab:20210112010508p:plain

 

 やはり150km/h超えの球をバンバン投じてくる剛腕は数値が高いですし、球を低めに集めたり動かしたりしてゴロを打たせるグラウンドボーラーは数値が低めになりますね。数値は高いに越したことはありませんが、低いからといって必ずしも悪いということもありません。

 

 さて、このように一応順位をつけてみましたが、みなさんのイメージと合致しているでしょうか?「○○より××の方が上だと思ってたけどなぁ」といった感想があれば、とりあえず覚えておいてください。率直に申し上げて、西武ファンである私の場合、「平良はもっと高いんじゃね!?」と思いました。同じ感想を抱いた方は、長いですが読み進めると幸せになれるかもしれませんので、どうかこのままお付き合いください。

 

奪三振率だけではわからないこと

 

 今回このような検証をしたきっかけは、その違和感が正しいのか、数字を使って定量的に確かめてみたかったためです。

 

 というのも、奪三振率という指標は、前述の定義の通りあくまで「奪三振数を9イニング分に換算した」ものです。「三振を奪う能力の高低である」とは誰も言ってません。では、そのギャップの原因は何なのでしょうか。

 

 様々な要素があるとは思いますが、今回は「打席の結果が三振になるかどうかは、投手だけでなく打者の能力にも大きく依存するのに、それが反映されていないためだ」*2という仮説を立ててみました。

 

 奪三振数という成績は、当たり前ですが誰から三振を奪っても一つ増えるだけです。世界のアベレージヒッターであるイチローから奪っても、ファームから上がりたてでプロ初ヒットすら放っていない緊張でガチガチの高卒ルーキーから奪っても、一つは一つです。言うまでもなく、両者の難易度は比べるまでもありませんが、イチローから三振を奪ったからといって、二つ記録されることも当然ありません。

 

 まぁ上記は例示としては極端ですが、例えば2020年シーズンで最も三振の多かったスパンジェンバーグは445打席で150三振を喫している一方で、首位打者に輝いた吉田正尚はスパンジェンバーグより多い492打席でたったの29三振なので、同じ主力打者でも奪三振の難易度に大きな差があるのが見て取れます。

 

 奪三振率という指標に、こういった「打者の性質」は加味されていません。いくら千賀や山本といえど、もし吉田のような三振の少ない打者とばかり何度も対戦すれば2020年シーズンような奪三振率を残すことは難しいでしょう。もちろんそんなことはありえませんし、先発投手であれば1番から9番まで幅広く対戦する機会があるので、シーズンを通してみれば難易度が平準化されることも十分考えられますが、検証してみないことにはわかりません。たまたま三振しやすい打者との対戦が多くて奪三振能力を過大評価されている投手もいれば、逆のケースもあるかもしれません。

 

 そこで今回は、打者の三振率も考慮した、より本質的(と思われる)奪三振という新たな指標を作ってみて、奪三振率とどのような違いが生じるのかを確認してみることにしました。

 

 では、具体的にどのような指標とするのが望ましいのでしょうか。

 

奪三振力の定義

 

 今回私が考えた奪三振K _ {p}の定義は下記の通りです。

 

\displaystyle{ K _ {p}= \frac{1}N \sum_{i=1}^n \frac{1}k _ {i} }

 

 すみません、やっぱり堅苦しいですね。Nは対象の投手が対戦した打者の総数、nが対象の投手の奪三振数、k _ {i}が三振を喫した打者の三振率(シーズンの三振数/打席数)になります。この数式の意味するところは、一つ一つの三振を1としてカウントするのではなく、三振を奪った打者の「三振しない力*3」として加算していき、対戦打者数で割るというものです。三振しない力は、1を三振率で割った数値、すなわち逆数になるので、打席数/三振数と一致します。*4

 

 例えば、先に例示したスパンジェンバーグの三振しない力は445/150≒2.97で、吉田正尚は16.97になります。すごい差ですね。

 

 そして、ある投手がスパンジェンバーグと5打席対戦し三振を3つ、吉田正尚と 4打席対戦し三振を1つ奪ったとすると、奪三振K _ {p}は下記のように計算されます。

 

\displaystyle{K _ {p}= \frac{1}{(5+4)}(2.97×3+16.97×1)}

 

 このような計算を、シーズン中の全ての奪三振振り逃げも含む)に対して行うわけです。もちろん、手計算では土台無理なので、コンピュータの力を借ります。シーズン中の試合データを溜め込んだデータベースを独自に作成しておりますので、そこからSQLというやつを使ってお目当てのデータを引っこ抜き、整理していきました。 

 

奪三振力の計算結果

 

 それでは早速、2020年シーズンパリーグ公式戦における、奪三振力の計算結果を見てみましょう。なお、「こんな細かいのいちいち見てられない!結論はよ!」という方は、下の「奪三振率との相関は?」という章までジャンプしていただいても結構です。

 

f:id:Lions_Datalab:20210112011526p:plain

 

やはり今季大活躍のモイネロが、頭一つ、いや二つくらい抜けていますね。左腕でありながら150km\hを常時超える直球を持ち、フジテレビ系S-PARKの恒例企画・プロ野球100人分の1位の変化球部門においては千賀のお化けフォークを抑えパリーグ1位となったカーブもあるのだから、納得の結果です。もはや「相手が誰であろうが関係ない」といわんばかりです。

 

 注目すべきは、見事新人王に輝いた我らが平良海馬。奪三振率では7位でしたが、この奪三振力では堂々の2位までランクアップ。パを代表する強打者である柳田や浅村から真っ向勝負で三振を奪っている印象が強いですが、吉田・中村晃・近藤・西川といったコンタクトの上手い巧打者からも三振を奪えていることが反映された結果だと思われます。

 

 全体的な印象としては、投手力の充実しているソフトバンクオリックス勢が上位に多く、以前Twitterでもつぶやいたストレート空振り奪取率とある程度相関がありそうかなといったところです。ストレートと変化球の威力は掛け算なので、空振りを奪えるストレートがあると変化球も活きるんですね。

 

 また、奪三振力のヒストグラム*5がこちら。

 

f:id:Lions_Datalab:20210118223538p:plain

 

 2.0を超えて一人だけ右端にいるモイネロを除けば、そこそこ正規分布っぽい形になっているので、指標としてそんなに的外れでもなさそうかなという印象です。だからこそ、そこから大きく逸脱したモイネロの傑出度が際立ちますね。

 

 余談ですが、西武ファンの管理人としては下位の投手が西武だらけなのが非常に残念です。特にドラ1コンビの今井・松本航は、本格派の投球スタイルを考えるとこの位置にいてはいけませんね。来季の巻き返しに期待しましょう。

 

別の見方をしてみる

 

 ただ数値の高い投手を比べるだけでは面白くないので、もう少しいじってみましょう。

 

 奪三振力は、一つ一つの奪三振に打者の「三振しにくさ」で重み付けをしたものではありますが、それでも打席数で割る以上、三振数が多い分数値は高くなります。

 

 そこで、奪三振力を奪三振率で割ってみます。すると何が見えてくるでしょうか?

 

 分母の「奪三振数に比例して増える数値」に対して、分子の「三振をしにくい打者から三振を奪うほど上がる数値」が高いかどうか、すなわち「三振を奪いにくい打者から三振を奪えているか」ということです。奪三振の総数自体は少なくても、三振しにくい打者に有効というのは、それはそれで価値がありそうですよね。

 

 その算出結果がこちらです。

 

f:id:Lions_Datalab:20210118224950p:plain

 

 上位の顔ぶれがガラッと変わっていますね。単純に奪三振率で割るという性質上、どうしても奪三振の多い投手は順位が下がりやすくなってしまいますが、それでも上位に残っているモイネロ・平良はさすがの一言。

 

 興味深いのは、トップ3人がいずれも全く違うタイプということ。抜群の制球力と決め球のカットボールを武器に凡打の山を築く唐川、アンダースローから多彩な球種を操り、緩急自在の投球で打者を翻弄する牧田、そして変則フォームと落差のあるフォークを武器にブレイクした森脇。

 

 共通点は右投げということと、勝ちパターンのリリーフであることくらいですが、唐川や牧田はプロの経験値も豊富で、犠牲フライも打たせたくない、ここぞというときに粘っこい打者から三振を奪う投球術を持っているのかもしれませんね。

 

 チェン・ウェインや榎田は投球回数がギリギリなので偶発的な参考値として除外すれば、TOP10はほとんど勝ちパターンのリリーフになっています。やはり試合終盤の勝負所では、代打も含め簡単に三振してくれない打者と多く対峙するため、そこで1シーズン戦い抜いた投手の数値が上がるのは必然なのかもしれません。

 

 そういった意味で、ここに割って入っているロッテ・小野やホークス・板東が来季どう成長していくのか、注目です。

 

奪三振率との相関は?

 

 最後に、本稿の主題である「奪三振率で奪三振の能力は測れているのか」について検証するため、奪三振率の順位が奪三振力では順位がどう変わるのかを見てみましょう。

 

f:id:Lions_Datalab:20210118232400p:plain

 

 奪三振率を奪三振力に換算した際、順位が上がれば青、下がれば赤になっていて、色の濃さが変動の大きさを表しています。個人差はありますが、結構順位が変動しているのがわかりますね。

 

 嘉弥真は14位から6位までランクアップしており、試合終盤の犠牲フライすら許したくない重要な局面を任され、左打者から幾度となく価値ある三振を奪ってきた証でしょう。

 

 また、増田・益田・森といったAクラスチームのクローザーが軒並み10位程度ランクアップしているのも興味深いですね。前章で述べた傾向と同様、やはり長い間タフな場面を任された分、嘉弥真と同様に価値ある三振を奪ってきたということなのでしょう。

 

 逆に大きく順位を落としたのが、勝ちパターンから外れてしまった吉田一将(26位⇒51位)や定着しきれなかった宮川(22位⇒40位)で、来季は終盤の勝負所で繰り出される巧打者からも三振を奪える球威やキレを身につけて、セットアッパー争いを制してほしいところ。

 

 また、順位変動のヒストグラムがこちら。

 

f:id:Lions_Datalab:20210118232933p:plain

 

 細かい順位で見れば結構変動があったものの、こうして見ると順位変動の分布は0付近に集中しているので、打者の性質を考慮した奪三振力の方がより奪三振能力の本質に近いと仮定した場合において、奪三振率は奪三振の能力の大枠を簡便に把握する指標として有効であることが確認できました。

 

まとめ

 

 いかがでしたでしょうか。

 

  今回の検証を通して、奪三振率は、非常にシンプルな計算で三振を奪う能力を測ることができ、指標として信頼できるものであるということがわかりました。はじめに」の記事でも述べたように、いちプロ野球ファンがプロ野球を楽しむために見る指標として「わかりやすさ」は重要だと考えておりますので、今後も選手の成績を確認する際には十分参考にして良いものだと思います。贔屓のチームの選手の成績をチェックする中で、奪三振率が高ければとりあえずポジっておきましょう。

 

 一方で、「打者の三振しにくさ」で重み付けをしてあげることで、より本質的な「三振を奪う力」を表現できる可能性も示せたかなと思います。何より、西武が誇るドクターK・平良海馬の順位が上がりましたからね!

 

 とまぁそれは冗談として。

 

 ファンとしてのバイアスはそれはもう多分にかかっていると自覚しつつも、モイネロの次と言われればやはり平良を連想しますし、私の印象と合致したので、個人的には奪三振力の方がよりドクターKのイメージに近いかなと思います。

 

 記事の冒頭で、奪三振率において「○○より××の方が上だと思ってたけどなぁ」という感想を抱いた方は、改めて奪三振率と奪三振力のランキングを見比べてみてください。そしてもし、奪三振力の方がよりイメージに近いものであったなら、分析者冥利に尽きるというものです。 

 

 今後はアイデアが浮かび次第随時この指標もアップデートしていきたいと思いますが、この「重み付け」は打率をはじめとした他の指標にもかなり応用できそうなので、そこもおいおい検証のうえ、ご報告できれば。

 

 最後に、長ったらしい本稿を最後まで読了していただき、ありがとうございました。よろしければ、リツイートでも何でもいいので何かしらポチっていただけると今後の励みになりますので、何卒よろしくお願いいたします。

 

 それでは。

*1:スポナビ様より抜粋。パリーグで対戦打者数100人以上の投手が対象。

*2:もちろん捕手の配球にも依存する部分はありますが、定性的で評価が難しいのと観点が発散するリスクがあるので、今回はフォーカス外としております。

*3:コンタクト率としてしまうと意味が変わってしまいますし、他に良いネーミングが思いつきませんでした。ご容赦ください。

*4: 当初は三振しない率(1-三振率)として定義しようかと思いましたが、これだとあまり差が明確にならない(上記の例だとスパンジェンバーグ0.663に対して吉田正尚0.941)ため、逆数をとることにしました。

*5:ある集合の分布を表したグラフのことです。この例だと、横軸が奪三振力になっていますので、「奪三振力が0.5~0.7の投手が10人いる」という見方になります。