July 6,2005
Runs Created
Runs Created 是 Bill James 創造出, 用來預測得分的統計量. 原形是: 上壘率 (OBP) 乘上總壘打數(TB), 加加減減, 有許多的變形.
或許是純數出身, 對於一些人為的統計量, 一直看不順眼, 總希望一個公式, 能有些直覺的意思.上壘率乘上總壘打數為什麼適合用來估計總得分? 只因為統計迴歸的結果不錯? 那些再加加減減讓統計迴歸的結果更好, 就更沒意思了. 要知道, 這統計量用了許多的變數, single, double, triple, hr, bb, sb, cs, sf, ab, pa 等等. OBP 乘上 TB 看起來簡單, 其實它等於是把一些係數固定了. 而一些變形的公式, 則只是放寬了一些係數的限制. 自由度越高, 可以近似地更好, 這是當然的道理. 若都沒什麼限制, 要做出一個係數不好看, 但近似地更好的公式, 也是可以做到的事. 但這真的有意義嗎?
其實, 若公式略改成: 上壘數乘上長打率乘上某個係數. 我反而可以接受. 重點是它能有個解釋. 得分要怎麼得? 先有人上壘, 然後後繼打者們幫他不斷推進到本壘 (全壘打, 就當自己推進自己). 所以, 總得分應該是像上壘數乘上送跑者回來的機率. 跟推進跑者最相關的, 大概就是長打率. 當然, 若實際計算, 要算之後各種不同的組合 (幾支安打加起來才送回本壘), 但用長打率乘上某個係數來估計推壘率, 應該算是還可以的一階估計. 因此, 我能接受總上壘數乘以長打率乘以某個係數的公式, 就因為它有背後的意義. 而照此再去變形, 例如把盜壘, 保送依某個比例加到長打率, 而得到一個更佳的近似推壘率公式, 那就也是有意義的. 因為係數不是人為加的, 而是算出來的 (比如, 從歷史資料, 可以計算, 保送平均推進了幾個壘).
會寫這篇, 其實是經過昨天發現 Manny 壘有人打得比較好, 而他的 VORP, RC 等卻偏低. 找找公式是怎麼算的, 發現果然跟壘上有沒有人的打擊狀況無關. 若是根據我說的 RC 是用總壘打數乘上長打率的概念, 事實上, 這兒的長打率應該用壘上有人的長打率取代, 到昨天為止, Manny 的長打率是 .559, 壘上有人時是 .714. .714/.559 約為 1.28. 這就是目前 Manny 雖然打點領先全聯盟, 卻被那些棒球統計嚴重低估的主要原因.