Lions Data Lab

選手レビューや、一風変わったデータ分析の発信を目指しています

球審のゾーンの違いを一般人が入手できるデータで検証してみた(前編)

 お久しぶりです。LDLです。

 

 せっかく開幕したのにTwitterばかりせっせと投稿して、こちらは疎かにしてしまって恐縮です。スクレイパー*1やデータベースの調整やら、仕事が年度末で忙しかったことやら、「徒競走じゃんw」と半ば小ばかにして絶対にハマらないと思ってたおウマさんに時間を吸われたのが原因です。

 

 我らがライオンズは開幕早々怪我人続出で苦しい状況ですが、同じように度重なる怪我に見舞われながらもそれを乗り越えて、1年間のブランク明けに強豪犇く93年有馬記念で奇跡の復活勝利を飾ったトウカイテイオーのように、最後の最後には1着でゴールしたいですね。そのためにも、若手には単に離脱者の穴埋めというだけではなく、「山川さんや外崎さんがいたら…なんて絶対に言わせない!」という意気込みで試合に臨んでほしいものです。

 

 さて、そろそろ本題に。

 

 今回のテーマは球審のストライクゾーンです。 長くプロ野球を観戦されてきたファンであれば、審判ごとに「この球審は外に広い」「この球審は低めを取らない」「うーん、この可変ゾーン」「意地になって取っちゃダメだよ、クソボールやないか!」といった印象を大なり小なりお持ちだと思いますが、そのあたりのふわっとした印象を、データに基づいてもう少し明確にできないか、という検証になります。今回も長くなりそうなので、前後編に分けてお送りします。

 

 目次はこちら。

 

 

データは事実ではない?

 

 データアカウントを運営しているくせにいきなりとんでもない暴言を吐いてますが、まぁ聞いてください。

 

 これをテーマに設定したのは、4/4(日)に行われた西武vsソフトバンクのある判定がきっかけです。ここの読者の大半であろう私のTwitterアカウントのフォロワーの方はピンときたかもしれませんが、8回裏の宮川vs松田の6球目です。

 

f:id:Lions_Datalab:20210411013359p:plain

 

 みなさんおなじみ、私もたいへんお世話になっているスポナビさんの一球速報のスクショです。図らずも広告がステマみたいになってますが、たまたまです*2。元のページはこちらからご覧ください。

 

 このインローにズバっと投げ込まれた150キロのストレート(⑥)、恐らく観戦していたほぼ全てのファンは「切り抜けた!」思ったはずで、私もガッツポしました。しかし、バッテリーも記載の通りベンチに戻りかけたものの、判定はなんとボール。私は普段パリーグTVで観戦していますが、比較的ホーム(この場合はソフトバンク)寄りになる解説や実況もかなり歯切れが悪かったので、恐らく鷹ファンも含めた誰もがストライクだと思ったのではないでしょうか。

 

 ただ一人、球審を除いては。

 

 実際、バッターボックスを俯瞰したカメラの画像や捕球位置を検証していた画像もSNSに投稿されており、率直に申し上げてあれは誤審だったと思っています。ただ、今回の趣旨はそれを糾弾することでも、是非を問うことでもありません。月並みですが球審も人間なので、100%正確なジャッジなんて不可能ですしね。

 

 今回のポイントは、データもボールの座標にプロットされているという点です。

 

データと事実の相違点

 

 「何を当たり前のことを言ってるんだこいつは」と思われたかもしれません。球審がボールと判定したのだから、データもボールになって当然で、仮に記録者にはストライクに見えたからといって、ストライクゾーン内に⑥をプロットするなど言語道断です。そうしてしまったら、記録と表示の整合性が取れなくなってしまいますからね。

 

 しかし、前述の通り、私はこの⑥は「ストライク!」とコールされ、ゾーン内にプロットされるべきだったと考えております。もちろん、「それはお前の思い込みだよ。」と言われてしまえばそれまでなので、そういう方はこの場で戻るなり閉じるを押していただいた方が良いと思います。以後、これは実際はストライクだったという前提でお話を続けますので。

 

 私はスポナビの関係者でもなんでもないので、この投球分布図がどのようにプロットされているかは存じ上げておりませんが、仮にスタットキャスト等のデータをそのまま使っているとすれば、人間のジャッジが100%機械と一致するというありえないことが起きてしまいますし、中継の体制が万全でないファームの試合だとたまに「不明」といったステータスになることからしても、恐らくスポナビさんの関係者が中継等の映像を見て人力で作成しているものだと思われます。

 

 さて、ここで起きたことは、ストライクゾーンに入っていたはずの球が、ストライクゾーンの外にされてしまったということ、つまり球審のゾーンが狭かった(狭くなった)ということです。まぁそれはそうですよね。

 

 ストライクゾーンのエッジのギリギリ内側を通過した球が、球審のジャッジによってギリギリ外側に記録されました。つまり、「内角が狭い」ジャッジを下されたわけです。

 

 そして、そういった球は当然のことながらデータ上では、ボールであってもストライクゾーンのエッジ付近に記録されます。仮に記録者が「ストライクっぽいなぁ」と感じ、エッジの内側にプロットしたくても、判定はボールなのだから、仕方なくエッジのギリギリ外にプロットせざるを得ないわけです。そこそこ反響のあった4/25(日)の楽天戦の際の私のツイートも、まさにこのケースだと思います。ゾーンの狭い球審であればそういったケースは増えるでしょうし、逆も然りです。

 

 ここである仮説を思いつきました。

 

仮説;ストライクゾーンの広い球審はエッジ付近でのストライクが、狭い球審はボールがそれぞれ多くなる。

  

 あくまでこれから検証しようという仮説なので、とりあえずツッコみはナシでお願いします。そもそも、これは全く同じ投球に対するジャッジでないと比較しようがないですし、記録者という存在も複数人いるはずで、プロットの傾向にも個人差があるでしょうから、いくらデータで検証したところで仮説の域は出ないのですが、ある程度の数のサンプルを集めればそこそこ平準化されて信頼できるデータになるのではないかと期待し、とにかくこの仮説を検証してみることにしました。

 

 もしこの仮説が正しければ、我々一般人でもデータに基づいて球審のジャッジの傾向を把握できるので、野球観戦がより一層楽しくなるかもしれません。例えば、平井プロの登板時に、ゾーンがワイドな球審であれば横の揺さぶりにバックドア・フロントドアを多用したり、狭いときはフォークやチェンジアップの割合が増えることが予想されますが、そのあたりの配球の合理性が見えてくるわけです。

 

 では、次の章では具体的にどのように検証していくかをご説明します。 

 

パラメータの設定

 

 まず、評価基準となるパラメータを設定します。今回は、文字通りゾーンのエッジ付近のストライク(「見逃し」とジャッジされたもの)・ボールの比率です。エッジ付近のストライク数をK_{e}、ボール数をB_{e}、その比率R_{e}を以下のように定義します。

 

\displaystyle{ R_{e}= \frac{K_{e}}{B_{e}}}

 

 分母と分子は逆でもよいのですが、とりあえずこうしておきます。例えば、エッジ付近のストライクとボールがそれぞれ6個と4個だった場合、R_{e}は1.5となります。

 

f:id:Lions_Datalab:20210430215532p:plain

 

 次に、エッジ付近の「付近」とはどこまでなのかを定義します。私のデータベースのソースとなっている一球速報のソースコードを見ればわかりますが、ボールの捕球位置は縦横二軸のpx単位で描画されています。今のところ、エッジからどこまでの距離が「きわどい」と言えるかわからないので、色々数値を変化させて様子を見てみましょう。このイメージにおいて、2020年シーズンにおける1軍の全試合の全投球を対象として、エッジからの距離dを色々と変えながら、R_{e}がどのように変わっていくかを示した表とグラフがこちらです。

 

f:id:Lions_Datalab:20210428010753p:plain

 

f:id:Lions_Datalab:20210428010555p:plain

 

 当然のことながら、エッジからの距離dを大きくしていくとボールもストライクも増加していき、最初はストライクの方が圧倒的に多かったのが、9~10あたりで逆転するのがわかりますね。単純に内側と外側では、dの増加に対するゾーンの面積の増加率が異なるので自然な結果といえます。

 

 とりあえずストライクとボールの比率が同じくらいのところ、すなわちR_{e}が1に近いところを基準に取った方が直感的に広い狭いを判別できそうなので、エッジからの距離dが10以内のゾーンを「きわどい」と定義しましょう。

 

 この「きわどい」ゾーンにおいて、ボールに比べてストライクが多い、つまりR_{e}が0.93より大きい球審は「ゾーンが広い」、0.93より小さい球審は「ゾーンが狭い」となるわけです。

 

 ただ、基準が0.93のままだと見通しが悪いので、R_{e}を0.93で割ったR_{n}というパラメータに設定し直すことで、狭い・広いの基準を1にしてやります。いわゆる正規化的なアレですね。

 

\displaystyle{ R_{n}= \frac{R_{e}}{0.93}}

 

分析結果

 

 では、早速2020年レギュラーシーズンに球審を務めた全ての審判に対し、きわどいと定義したゾーンにおけるストライクおよびボールの数とR_{n}を見てみましょう。

 

f:id:Lions_Datalab:20210429235157p:plain


 いかがでしょうか。

 

 繰り返しますが、見方としては、R_{n}が低いのは「狭い」球審、高いのが「広い」球審になります。どちらが良いかは打者か投手かによって変わるので、とりあえず昇順で並べています。また、割合の性質上、データの総数が300以下だとピーキーな数値が出ているように見えるので、そういった球審は参考として順位からは除外しています。

 

 私個人としては、結果を見た瞬間笑ってしまいました。なんせ4/25(日)の試合にて狭すぎるゾーンで平井プロや楽天のルーキー・早川を苦しめ、SNS上で双方のファンの間で物議を醸した球審である長井氏がダントツで低い0.59という数値をたたき出したためです。もうこれだけで、専用のコードを書いてこの分析をやった甲斐があったかなと思ってしまいました。

 

 もう一つ興味深いのは、中央値の1となっている、有隅氏です。1という数値は、全ての審判員のなかで最も平均的なゾーンでジャッジしていたことになりますが、そんな彼は2020年のNPB最優秀審判員として表彰されているんですよね。まぁ奨励賞を受賞している牧田氏が狭さ2位の0.82である以上、たまたまと解釈した方が良いのかも知れませんし、そもそもジャッジというのはストライク・ボールの判定だけではないのですから、参考程度ととらえておきましょう。

 

 余談ですが、同年のファインジャッジ賞を受賞したのは4名おり、うち3名は長井氏・梅木氏・須山氏で、参考も含めた場合の狭さのTOP3、残り1名の岩下氏は、こちらも参考ながら広さのTOPでした。これも偶然でしょうけど、ここまで偏ると何やら意味ありげな気もしてしまいます。

 

まとめ

 

 前編はここまでです。

 

 とりあえず最初の分析結果をご提示しましたが、この結果がリアルを反映できているかどうかは、現時点では正直私もよくわかりません。長井氏はたまたま符号しただけかもしれませんし、他の数多の球審については、これからの観戦の中でチェックし、妥当性を検証していきたいと思います。皆さんもこれから観戦する際は、思い出したらで良いので、この表とリアルを照らし合わせてご意見ご感想をお寄せくださるとブロガー冥利に尽きます。

 

 実は記事を書き始めたのは4月上旬だったものの、どうも筆が乗らずにリリースまで間延びしてしまいましたが、長井氏の件で分析結果に妙な自信を得られたのは怪我の功名でしょうか。Twitterで試合ごとに投手のデイリーコンテンツは発信しておりますが、こっそり打者にフォーカスしたデイリーコンテンツも鋭意作成中で、そちらに浮気しているのも原因ですね。結構良いものができそうですが、移り気で飽きっぽい性格はどうにかしたいです。

 

 後編では、今回分析した広い・狭いだけでなく、ワイド・縦長といった形状や、平井プロの好投を願ってバックドア・フロントドアが有効な球審といった分析もできたらなと思っております。(本稿執筆時点ではまだコードを書いてないので、できなかったらごめんなさい)

 

 最も物議を醸す「可変ゾーン」についても取り上げられたらなぁとは思うのですが、残念ながら現時点ではアイデアがありませんね。早く米国のように、一般人にも公式の詳細なデータが公開される日を心待ちにしております。

 

 それではまた!

 

 

 

*1:webページからデータを自動で収集するツール

*2:私は120連でも引けませんでした