セイバーメトリック
データーを集める
セイバーメトリック化:
SABR カメリカ野球学会とmetrics 測定法を組合わせた造語
選手を客観的に評価し、チームの勝利に貢献する要因を
統計学的に明らかにしょうという試み
自然に集まるデータ:
勝敗表のデータ:勝敗やと得失点など、試合の記録は審判部
が扱っている
スコアーをつけることで集まるデータ:
毎試合、毎打席、スコア付ける
打席数、安打、打点、盗塁、四死球、三振の数を聚める
データの加工
塁打数:単打数x1+二塁打x2+三塁打x3;
本塁打x4
打率:安打数/打数
出塁率:(安打+四球)/打席数
セイバーメトリックスでは、打率より出塁率が重視されます。
長打率:塁打数/打数
OPS:出塁率+長打率
得点への貢献では、四球一つはシングルヒット0.83本分
ホームラン1本は2.25本分で、4本でないこと
参考書
鳥越規央・データスタジアム野球部
「勝てる野球の統計学ーーセイバーメトリックス」
トラヴェス・そーチック/桑田健訳
「ビックデータ・ベースボールーー20年連続で負け越し
球団ピッツバーグ・パイレーツを甦らせる数字の魔法」
世の中の統計データ
同様の種類がある
業務上自然に集まるデーター:
業務統計:代表例「貿易統計」財務省
税関業務によって貿易量が把握される
ビックデータ:これも自然に集まるデータ
インターネット上のアクセス状況を示すログデータ
コンビニの販売POSデータ
役所の住民票:統計データの一種
調査統計:
国勢調査 (5年に一度)
後、
加工統計があるー代表は「国民経済計算」