March 14,2006

Another example that current baseball statistics sucks

在 ptt 的紅襪板,看到有人提到用統計的方法,在討論如何排棒次。這方法起源於 Value of OBP and SLG by Lineup Position 對 OBP 和 SLG 跟得分關係的分析。它將 OBP 跟 SLG 拿去跟得分作線性迴歸,得到 OBP 跟 SLG 要怎麼加權後相加,會對得分有較好的預測。它又將第一到第九棒的 OBP 和 SLG 分開去跑線性迴歸,因此得到每一棒的 OBP 和 SLG 分別對總得分有如何的影響。相關的係數,可以在連結中看到,我就不去做一個表格。

接下來有不少人利用這個線性迴歸的結果,開始討論起怎樣排棒能得最多分。這是其中一篇,在那文章中,還可以看到它引更多之前的討論,甚至有人寫好程式,你若輸入九個人的資料,它可以告訴你,根據那迴歸結果,怎樣排棒次,可以讓總得分最多?

若你對棒球統計有興趣,或是你學過統計學最基本的線性迴歸,你對這些討論有何看法?贊成嗎?

今天我先不想討論原本那篇線性迴歸分析作得好不好的問題。假設用那十八個變數,去作線性迴歸是個很好的模型,fit 地相當好,當你將例年任一隊某年的各棒成績代入,得到的該隊總成績都蠻接近實際的得分。即使在這樣的假設下,我們是否可以用這模型去評估,如何排棒能得到最多的分數?

因為要用那模型去得到最多的分數,因此各棒的重要性決定在於 OBP 跟 SLG 前面的那個係數。從 OBP 上來看,第三棒的重要性排在九棒中的第五名,從 SLG 來看,更只有第六名。第三棒要排球隊中第五好的打者,你相信嗎?看來,美國職棒的教練都是一群白痴,居然大部份人把最好的打者放第三棒。

統計不是這樣解讀的。線性迴歸的係數只告訴我們,這個變數在你用的數據下,跟要看的結果,有多大的關係。今天你用了過去的數據作分析,而過去的數據,是在從以前到現在,教練們的排棒下,各棒次跟得分間的關係。當你用自己的喜好去排棒,你的樣本就變成跟原樣本大不相同,而你卻套用相同的公式,那就大大有問題。

今天你要說第九棒比第八棒重要,你必須做的事是,找出兩大類的資料,他們的前七棒成績相當,而一類是第九棒比第八棒好,另一類是第八棒比第九棒好。在這樣的情況下,若前者的得分的確在統計上明顯比後者高,你才能說第九棒比第八棒重要。若只是在所有資料上作迴歸,得到第九棒的係數較高,你得到的資訊只是:在以往教練的排棒下,我們要猜這隊得分多不多,看第九棒比看八棒有效。

對於這些迴歸出來的數字,我們可以這樣解釋(只是一種解釋,而不是任何的統計推論),球隊的強弱,不一定在於它的最好打者有多好,而可能是它有多少不錯的打者。因此,從第三棒打者,你看不出該隊得分能多高。反而第九棒都還能排出上壘率高的,比較有可能是個很會得分的球隊。

我說過很多次,統計不會騙人,騙人的是解讀統計的人,這又一個很好的例子。這是為什麼我應該要很高興統計能用在棒球上,但我總是無法高興起來。當現在的棒球統計,經常會出現類似這樣荒謬的推論,對於目前棒球統計分析的文章,還是暫時把它當作茶餘飯後的娛興節目就好。



Posted by bubblesld at 樂多Roodo! │22:35 │回應(10)引用(0)棒球統計
樂多分類:運動 共同主題:MLB 工具:編輯本文
Ads by Roodo! 

引用URL

http://cgi.blog.roodo.com/trackback/1257814
回應文章
哈~謝謝你解答了我的疑惑。
我研究了PTT板上波的那個網頁,覺得用這樣來決定棒次順序實在很怪,不過因為對統計沒什麼研究所以覺得大概是自己錯了:P

沒想到其實這麼直觀。
Posted by KDE at March 15,2006 18:30
想聽聽各位對WBC的看法
我聽說美國根本沒人在關心 那何必辦呢
美國打的爛 裁判爛 賽程安排爛
這個經典賽是為了讓大家討厭美國而舉辦嗎
尤其是幾個誇張的判決
Posted by Papi at March 17,2006 14:03
關於美國根本沒人在關心的說法,根據幾個網站的反應,我想跟事實有些出入。我聽到很多人表示,一開始對 WBC 沒興趣,但後來卻深深被比賽所吸引。大學籃球雖然在美國有很大的觀眾群,但也不是所有棒球迷都一定對此,或其它運動有興趣。而 WBC 的比賽,至少比春訓的比賽有看頭許多。當然,在今天美國輸球後,接下來的比賽,在美國的收視率必然下降。

我個人是對 WBC 持正面的態度。萬事起頭難。雖然在賽程設計,比賽日期等等一堆事情上,這次可能不完善,但 WBC 仍呈現出非常不錯的比賽。若之後能再改進,好好辦,相信會有相當不錯的市場。

ps: 我是對美國職棒的總冠軍叫 World Champion 有點微詞。
Posted by Bubble at March 17,2006 23:29
MLB仍然是世界最高殿堂 因為八強除了日本和古巴 其他六隊主力都是MLB
屢屢驚奇的南韓也是靠了幾個大聯盟投手和本土選手拼命的演出
但是我更佩服日本和古巴
他們證明了他們兩國本土選手確有和大聯盟一拼的實力
古巴一直沒人知道他們真正的實力 這次他們和MLB明星交手絲毫不落下風
日本職棒水準一直很高 但是美日明星對抗賽一直不是很有參考性的比賽
這次日本陣中僅有Ichiro,大塚為MLB球員 而且所有在美國的日本球員都是自己養的 才去挑戰
讓我更看清楚日職的實力 之前羅德的總教練說要和白襪來場真正的世界大賽我本來有點不以為意
現在我倒是覺得打個七戰四勝的系列賽 白襪雖然比較強也未必能贏過羅德
看西岡剛在wbc優秀的演出 我覺得美日職棒冠軍交手 也是不錯的賣點
Posted by Cliff at March 18,2006 00:03
美日總冠軍對抗賽聽起來有賣點!
但是如果MLB球隊不小心輸了
那叫World Champion
不就自打嘴巴.......
Posted by Tommy at March 18,2006 14:53
誰知道ERA為何要除每局除九

不要跟我講棒規則第10.....我知道

我要知道是誰訂的還有來由

看到請回答謝謝
Posted by ERA at March 21,2006 04:12
Theo就這麼樣將Arroyo給交易出去了,比起Damon,我還懷念Arroyo多一點。現在我比較好奇的是,Arroyo在這個一月新簽的合約裡(11.25M/3yr),究竟算是給了Red Sox多少的hometown discount?從年資上看起來,他雖然從2005年起就擁有薪資仲裁的權利,但那時應該只是super 2,也就是說,這三年合約剛好涵蓋了Arroyo在成為FA之前的三個薪資仲裁的年份;我的感覺是,這個約的確讓他少拿了1~2M,但似乎也沒有像媒體說得那麼誇張。

不過,還是很失望Arroyo被換走就是了。
Posted by eric at March 21,2006 09:28
Pena長打力不錯 但是選球有點........
上壘率整個不行 不過以他的年紀 因該還有進步空間
這兩年都是300多AB 但是分別打出26,19隻HR
加強選球的話 也許能接下Nixon以後留下的位置 長打力很不錯
Posted by Papi at March 21,2006 10:05
The Hardball Times那篇文章並沒有根據那個回歸結果來寫作,作者Dave Studeman在第三段有指出靜態的回歸分析結果不能拿來做處理動態的排棒分析問題。事實上它有在他引的那些blog的comment中留下他的質疑,也造成一些後續討論。

我猜是紅襪板的benchman兄沒有細讀那篇文章的關係,也許要 po 一篇勘誤一下。 XD

Studeman 在您引的這篇文章中參考了retrosheet的一篇馬可夫鍊排棒分析以及"The Book"這本新出的棒球統計書籍裡有關排棒的一章來看看這個問題,基本上不是他自己的看法。

"The book"這本書的作者是tangotiger(http://www.tangotiger.net)和現在已經在Cardinals球團裡任職的一個棒球統計玩家MGL合寫的。書中提到了幾件事:像是一二棒其實很少是某一局的leadoff hitter,更多的時候他們是在壘上有人的時候上場打擊;第三棒所打出的安打對得分的貢獻是前五棒最低的,因為他們上場碰到最多的情況是兩出局無人在壘等等。

我沒看過這本書,不過就文中所述由這幾項研究得到的結論和誤用迴歸分析來排棒次的文章結果很類似。但我不知道如果棒次改變了每個打者上來碰到各種情況的頻率是否還是會相同,不過比較可以確定的結論是現在的排法似乎不能把得分效益最大化就是了。

前兩天剛好看到這個blog,覺得這裡的文章寫作品質相當棒(尤其是棒球統計相關的文章,我正好在學數統 ^^||)
在此表示我的佩服之意。
Posted by ideo at March 25,2006 19:34
我以流水帳自許,若能讓任何人覺得還可以讀,我就很高興。用佩服的字眼,就太過獎了。

我引 Hardball Times 那篇,是因為他了不少其它用那方法的文章,可以方便點去看。那篇的作者雖然不同意那種排棒方式,但他所謂 "a static regression model really shouldn't be used to construct something as dynamic as a lineup",並不是那方法錯誤的主要徵結所在。重點是,迴歸係數影響的是現有的數據模式下,某個變數跟結果間的關係。這跟動態,靜態,沒什麼關係。即使一到九棒是九個不相關,沒有互動的變數,那方法依然沒有道理。

我也沒看過 "The book"。我大概是不大會願意花錢去買這類的書,至少目前我覺得不值得。retrosheet 那篇馬可夫鏈的文章,剛稍微翻過。我認為比較有參考價值的例子是 1999-2004 巨人隊的情況。那篇文章大部份是以棒次去得 transition matrix,在各隊每天打線可能不固定的情況下,這可能有問題。但這不算什麼大問題。作者認為他的方法說明了現行排棒不佳,有過份解讀的嫌疑。因為各棒實際的成績,跟原本他們被預期的,可能不一樣。有可能不是教練的排法不好,而是球員打出的成績不如預期。那個巨人隊六年的例子,剛好可以拿來檢驗。LF 當然是最好的打者,而 2B, RF, 1B 是接下來較好的打者。而作者根據他的模型所得的結果,LF 的確應該在第三棒,而這四名打者應該要在二到五棒。

一開始 NL 和 AL 的例子。AL 方面,結果是第三棒要放原本的第四棒。若去看一下 AL 的成績,第四棒其實是表現最佳的棒次。NL 方面,結果是第三棒要放原本的第二或第四棒。第四棒在 NL 是第二佳的,第二棒則是第四。用棒次的例子不如守備位置,因為守備位置通常不大動,但棒次可能因表現而變,因此結果較不可靠。不過,不管怎麼說,我都看不出最好的要放在 #1, #2, #4。

至於那篇文章中,因左投右投而排棒的,實在有點扯。

最後,關於"像是一二棒其實很少是某一局的leadoff hitter,更多的時候他們是在壘上有人的時候上場打擊;第三棒所打出的安打對得分的貢獻是前五棒最低的,因為他們上場碰到最多的情況是兩出局無人在壘等等。" 的說法,我也聽過。但實在是沒什麼道理。又說一二棒很少是某一局 leadoff hitter,卻又說第三棒上場碰到最多情況兩出局無人在壘,到底這種情況是多是少,夠不夠多?怎能一句話中,前後如此不一致...
Posted by Bubble at March 25,2006 23:31