Lions Data Lab

選手レビューや、一風変わったデータ分析の発信を目指しています(メニューバー工事中…)

【定量評価】緩急ってどれくらい有効なの?(前編)

どうも、今年の目標の一つとして「毎月ブログ更新」を掲げながら、毎度更新がギリギリのLDLです。

 

長いことやるやる詐欺をし続けてきた緩急ネタを、今回ようやく書きたいと思います。

 

 

はじめに

 

さっそくですがみなさん、「緩急のきいたピッチング」と問われたら、どのような投球あるいは投手を思い浮かべるでしょうか?

 

古くはスローカーブを武器に活躍した阪急の星野伸之投手や中日の今中慎二投手。

 

ちょっと前だと変則気味の招き猫投法で活躍したロッテの成瀬善久投手やアンダースロー渡辺俊介投手。

 

多投はしないものの超スローボールで観客を沸かせた日ハムの多田野数人投手にバリバリ現役の伊藤大海投手。

 

西武OBだと、2008年日本シリーズで当時下火だったカーブを武器に巨人打線をきりきり舞いにした岸孝之投手、パームボールが代名詞の帆足和幸投手や「フォームの緩急」でも幻惑した牧田和久投手あたりでしょうか(だ、誰も残ってない…!?)

 

現役だと、西武が散々カモにされてきたオリ宮城大弥投手なんかは抜群に上手いなぁと感心していつも観てますね。

 

これまで挙げたように、緩いボールを武器に様々なタイプの投手が球史に名を残してきており、緩急の有効性に対して異論を唱える方はあまりいないと思います。バッティングはタイミングを合わせてナンボですから、例え野球未経験の方でも直感的に納得がいきますよね。

 

ただ、そういった定説をデータを使って深堀りするのが当ブログ。

 

今回も、いつも通りwebで得られる試合データをいじくりまわし、誰でも理解できる簡単な方法で緩急を数値化して有効性を検証していきたいと思います。データ処理の方法は2種類ありますが、前編ではそのうち一つめをご紹介していきますね。

 

それではいってみましょう。

 

数値化方法①「標準偏差

 

一つめは、広角打法の記事でも使った標準偏差を利用する方法です。

 

標準偏差とは集合の「ばらつき」を数値化した指標です。計算方法もシンプルで、「集合の平均値と各要素との差(=偏差)の二乗を合算し、要素の個数で割ったもの(=分散)の平方根」です。義務教育でも習う、ばらつきを定量的に示すには最もポピュラーな指標ですね。

 

「何言ってるかわからん!」って方もいらっしゃるかもしれませんが、以下に例を示しますのでご安心を。

 

上の表のような配球になった場合、5球の球速を表に記載した式に従って平均⇒分散と計算していくと、標準偏差は5.3になるので、これが方法①における緩急を表す指標になります。以後は緩急指標Sと呼称します。

 

では、いわゆる緩急の効いた配球とそうでない配球でどの程度差が出るのか、別の計算例と比較して見てみましょう。

 

打席①はさきほどと同じで、速い球のみの配球ですが、打席②はスローカーブを織り交ぜた緩急のある配球となっています。数値を見ると、①が5.32で②が20.45と4倍近くにまで増加しているのがわかりますね。ただ緩い球が多ければ良いというわけでもなく、打席③のように速い球が全くないと数字も上がりません。「緩急」の文字通り、速い球と遅い球をバランスよく使うことで大きな数値となる指標になっています。

 

今回検証する仮説は、「緩急が効くほど打者は打ちにくい」ことなので、これが正しいのであれば指標の数値が大きくなるほど、安打になりにくいはずです。それを視覚的に検証すべく、指標を横軸にとって一定値間隔で区切り、その区間の打率を縦軸にとってプロットしてグラフとして可視化します。例えば、(ありえないですが簡単のため)シーズンが10打席で、その結果と指標Sが下表のようになった場合…

 

グラフは下記のようになります。

 

実際のデータに対して同様のデータ処理をした場合、もしこの仮説が正しければ、下図のようにグラフは右肩下がりになるはずですね。

 

 

データ分析結果


さぁ、ようやくここからが本番です。

 

本稿ではプロ野球の2021年・2022年レギュラーシーズンの全打席(※球数が少なすぎると標準偏差の信頼性が低下するため、5球以上の打席が対象。かつ打席やデータソースにて球種や速度が一つでも欠落している打席は除外。後者は結構多い。)を対象として、このようなデータ処理をしてあげます。例によって手計算だと途方もない労力を要するので、私が個人で構築しているデータベースをソースとしてコンピュータの力を借りて計算しました。

 

その結果がこちら。

 

2021年は途中までは上手い具合に仮説通り右肩下がりとなっていますが、指標14あたりを境に打率が爆上がりしています。

 

2022年に至っては指標14以降が高いというのは同様で、両年ともほんのりですが二次関数のような形になってますね。

 

特に14以降が最大値に近い、すなわち球速のばらつきが大きい≒緩急が効いている打席ほど被打率が高い傾向になりました。正直、仮説を裏付けるデータになると半ば確信していたので、出力したときはかなり驚きましたね。

 

まぁこれは所詮2年分のデータでしかなく脚注の通りデータ欠損も多いので、2020年以前にも同様のデータ処理をするとまた違った結果になるのかもしれませんが、なかなか興味深い傾向ではあります。ぱっと見ではなぜこうなったのか、原因が思いつきませんね…。

 

なお、打率が全体的に低い傾向にありますが、これも脚注に示した通り除外しているデータによるものと思われます。ソースの性質上、ヒットのときは球速が抜ける傾向が多い気がするので…。(ここは細かい検証はしていませんので、おいおい)

 

そこはご了承くださいませ。

 

まとめ

 

いかがでしたでしょうか。

 

今回は毎度おなじみ標準偏差を使って、プロ野球で有効とされている「緩急」という概念の数値化を試み、打率との相関を探りました。

 

結果、予想と異なる傾向が見えて私個人としてはなかなかに興味深い情報を得られたので、労力はかかりましたが満足しています。

 

一方で、実はこの標準偏差を使った方法①にはある欠点があります。後編では、そこを加味した方法②をご紹介しつつ、同様のデータ処理をしてどのような傾向が見えてくるのか探っていきたいと思います。

 

こちら、データ処理はほぼほぼ完了しており、次回こそは余裕をもった時期にお送りできればと思っておりますので、ご一読いただけますと幸いでございます。

 

それではまた!