Lions Data Lab

選手レビューや、一風変わったデータ分析の発信を目指しています

【2021・2022版】球審のゾーンの違いを一般人が入手できるデータで検証してみた

 たいへん遅くなりましたが、新年あけましておめでとうございます。

 

 昨春からずっと放置していた当ブログ。更新が滞ると広告が否応なく頭に掲載されてしまうみたいですね…。そうならぬよう、今年は心機一転、最低月1での更新を目指していきたいと思ってますので、今年もどうぞよろしくお願いいたします。

 

 というわけで、ギリギリにはなりましたが1月のノルマを達成すべく、手始めに2020シーズン後に1度アップしてそれっきりだった球審のゾーンネタの2021年・2022年シーズンにおける集計結果をご報告いたします。

 

 今回の分析にあたりパラメータは若干いじったものの、基本的な考え方は初稿と同じなので未読の方や内容を忘れてしまったという方はこちら↓をご一読くださいませ。

lions-datalab.hatenablog.com

 ものすごくざっくりで申し上げると「ストライクゾーンの境界付近におけるジャッジにおいて、いわゆる”広い”球審なら見逃しストライクが、"狭い"球審ならボールが多く記録される」という仮説を立て、公開されているwebサイトから集計したそれらのデータから審判ごとのジャッジの傾向が調べてみる、といった趣旨の記事になります。後編は、コード書くのがしんどそうなのでネタが尽きそうになったら手をつけてみます…。

 

 それでは早速本編に参りましょう。

 

 

パラメータの設定

 ここはそれほど大事なお話でもないので、面倒な方は読み飛ばしていただいて構いません。

 

 設定すべきパラメータは一つだけで、「ストライクゾーンの境界付近(以下、エッジエリア)」をどの程度のサイズにするかです。ここが広すぎると、「きわどいと言えばきわどいけど、まぁジャッジ通りだよね」というボールをカウントしてしまうので、本稿の趣旨に合致しません。反対に狭すぎると、対象となる投球の数、すなわちサンプル数も当然減少するので、値がピーキーになりすぎて信頼性を損ねます。例えば、仮に300打数100安打で打率.333の打者がいたら優秀なアベレージヒッターと評してよいと思いますが、3打数1安打の打者がいても同様の評価をすべきではないのと同じですね。傾向を正しく探るには、一定数以上のサンプルが必要になります。

 

 ではどのあたりの数値とするかというと、全ての試合をしっかり見たうえで、対象となりそうなボール、すなわち(主観にはなりますが)ストライクに見えたもののボールとされたジャッジあるいはその逆を全てカウントし、それらのエッジからの距離の分布を根拠とするのが理想ですが、さすがに私一人で調査するには到底リソース不足です。そこで、前回と同様の方法で、データに基づいてそれっぽい数値を「えいや!」と決めてしまいます。

 

 エッジエリアの中心~端までの距離dを少しずつ変えながら、見逃しストライクとボールのジャッジがおよそ半々になるところが正しいと仮定して、探してやります。全ての投球に対し、エッジエリアにおけるストライク数をボール数で除した指標を以前の記事に倣ってReと設定してあげると、ストライクとボールが半々なのでReが1に近いところが目標値です。2021・2022両シーズンについて、縦軸をRe、横軸dとしてプロットするとこうなります。

 

 

 このグラフから、①シーズンごとの傾向に大きな差はないことに加え、②両シーズンともにd=4のときにReがほぼ1(2021は0.87、2022は1.11)になることがわかりますね。よって、両シーズンともにd=4のエリアをエッジエリアと設定して、球審ごとにReを求めていきます。

 

 最後に、Reをそれぞれ0.87、1.11で割って正規化(のようなことを)することで、1.00を平均値として横並びに比較できるようになります。その数値をRnとし、最終的にそちらを使って評価します。

 

2021年・2022年シーズンの結果

 それでは本題である、2021・2022シーズンにおけるRnの集計結果を見てみましょう。あ、結果を見る前に、まずご自身で”広い”球審や”狭い”球審をイメージしてみてくださいね。イメージとデータを比較して、イメージ通りだった部分とそうでない部分の有無やそれがどこに起因しているのかを考察するのが、データを見るうえでの醍醐味というやつです。

 

 表は、両シーズンにおける全球審Rnをまとめたものです。Rn=1.00を基準として、このデータ分析手法において"広い"球審ほど数値が大きくなり、"狭い"球審ほど数値が小さくなります。

 

 

 明確に傾向が出ている球審もいれば、1.00を境に傾向が逆になる球審もいますね。後者については、前述した「きわどいと言えばきわどいけど、まぁジャッジ通りだよね」というものをシーズン・球審ごとに異なる割合で含めてしまっていることが原因と考えられます。このデータ分析は、そういった偏りもサンプルを増やせばだいたい平準化されるだろうという仮定のもとに成り立っているので、精度を上げるには、やはりもういくつかのシーズンでデータを採っていく必要がありそうですね。

 

 一方、両シーズンともに同様の傾向がある球審もいますので、それも抽出しました。Rn=1.00の+10%である1.1以上の球審は「広い球審」ということで薄い青に、-10%である0.9以下の球審は「狭い球審」として薄い赤にそれぞれ塗り分けました。


 この結果から、下記のように分類できそうです。(敬称略)

 

"広い"球審 名幸、木内、白井、嶋田、丹波、橘高

"狭い"球審 秋村、山口、眞鍋、小林、長井、吉本

 

おわりに

いかがでしたでしょうか。

 

 2022シーズンに色々と話題をさらった白井球審は、シーズン通したこのデータ的には"広い"球審に分類されるようですね。

 

 イメージと合っていた球審、そうでない球審など色々あったと思いますが、来る2023シーズンはこのデータも頭の片隅に置いておいて観戦していただくとより面白くなるかもしれません。

 

 私も、"広い"球審と"狭い"球審、それぞれのケースにおいてバッテリーの攻め方がどのように変わるのか、注視して観戦に臨みつつ、適宜Twitterでそのあたりに言及していきたいと思います。

 

 今回は以上です。まだデータ分析は全く手をつけてませんがネタはいくつかストックしていて、次回は「緩急の有効性評価」「カウント球の有効性評価」「スプレーヒッターの定量的評価」あたりをテーマにできればと思ってます。

 

 今後ともよろしくお願いします!

 

オマケ:2020年シーズンと比較しない理由

 さて、ここで賢明な読者の皆様であればこう思うはずです。

 

 「どうせなら2020年のデータも並べてよ。3シーズンで比較した方が傾向がより見えやすいじゃないか」

 

 もちろんその通りで、2シーズンだけの比較だと数値が基準となるRn=1.00を境にブレる審判も多かったですが、3シーズン連続で同様の傾向が表れれば、ジャッジの傾向に対する確信度がより強固なものになりますからね。以下では、あえてそうしなかった理由をご説明します。

 

 結論から申し上げますと、「ソースのプロットの仕方が2021シーズンから変わった可能性が高い」ためです。

 

 前の記事を読まれた方はお気づきだと思いますが、Reを1付近とするために、2021・2022シーズンではともにd=4と設定しておりますが、2020シーズンではd=10と設定しており、数値が大きく異なります。エリアのスケール自体は変わっておらず、仮に2020シーズンでd=4とするとReは6.46にもなってしまいますので、両者の傾向に違いがあることはご理解いただけると思います。

 

 ではその差異を引き起こしたのは何かというと、恐らくソースのプロットの方針が変わったためと推察されます。どう変わったかは、百聞は一見にしかずということで、3シーズンの全ての投球をプロットしたものをご覧いただければわかると思います。(画像は対左打者のみ抽出)

 

 見ての通り、2021・2022シーズンは万遍なく連続的にプロットされているのに対し、2020シーズンは画面を5×5の25分割としてプロットしていたようなのです。そうなれば、エッジエリアのプロットも必然的に減少しますから、dReの相関に差異が生じてしまったわけですね。

 

 もちろん私はプロ野球サイトの運営側の人間でも何でもなく、データを参照させていただいているだけのただの一般人ですから、これはあくまで憶測に過ぎませんが、少なくとも2020と2021・2022の分析結果を同列に扱うべきではないことはご理解いただけたかと思います。

 

 そうはいってもせっかくなので、3シーズン全てにおいて同様の傾向がみられた球審を下記に列挙します。ご参考まで。※()内は2020シーズンにおけるRn

 

「広い」球審 名幸(1.29)

「狭い」球審 秋村(0.86)、長井(0.59)、吉本(0.88)