March 31,2006
Overuse of VORP
VORP 這玩意在目前的棒球統計可以說是個寵兒,在討論 MVP 時,VORP 會被提及,在球季前,各隊的 preview 上也常可以看得見 VORP。VORP 真的那麼好用嗎?
VORP (Value Over Replacement Player) ,它是為了衡量一個球員比一個替補球員 (replacement player) 能為一個普通隊 (球員成績為聯盟平均)多製造幾分。VORP 是用球員打擊上的一些表現去推估他為球隊多製造幾分,它用的是一些被認為跟球員本身能力有關的統計量(比如用長打率而非壘上有人時的長打率),但在討論 MVP 這種實際貢獻度上,自然不如實際的打點與得分。當棒球統計界在揶揄其它作家討論 MVP 時,只懂打點不懂 VORP,這真是一個極大的諷刺。這類的批評,在去年末討論 MVP 時已經很多,這兒就不再重複。
在討論 MVP 時不適合採用 VORP,那在球季開賽前,分析展望球隊這季的表現時,我們常可以看到作分析的作者把各球員的 VORP 放上去,最後把全隊的 VORP 加起來,以總共的 VORP 來看各隊的強弱。這是不是個好的作法,或者是不是必要的?
比起用在 MVP 的討論,用 VORP 在季前作分析預測,的確比較沒問題,因為打點這數據被認為是跟運氣有關,不是種能力,因此較沒有預測性。於是,用比較有預測性的數據來推估表現,可能是較保險的方法(當然,前提是 VORP 這樣的推估方法是好的)。但是,VORP 是假設其它隊友都是聯盟平均水準的情況下,計算出來的值。實際的狀況下,隊友當然並非都剛好是聯盟平均水準,分別計算 VORP,再加總,那還不如直接去計算團隊的整體各項打擊數據,然後用 RC 公式去計算整隊的總得分(前提是 RC 公式好,不過,VORP 的計算也是要用這公式,所以是站在同樣的基準上)。
有人或許會說,看個人 VORP 的好處是,可以看出這球隊的強弱在哪裡。就這觀點來說,的確是沒錯。但仍有一個問題,為什麼要在意 value over "replacement player"?而不是只看 value 就好?VORP 之所以要引入 replacement player 的觀念,主要是用來看單一球員所“增加”的價值,也就是單一球員比 replacement player 多出多少價值。這是個不錯的概念,但是,若在意的是某隊在各位置上的優劣,比較的對象應該是聯盟的平均,而不是替補球員。跟平均比,至少知道這位置是加分還是扣分,雖然因為不知標準差,仍然看不出差多少。
VORP 是要跟 replacement player 比,那結果能解釋的應該是某球員對該隊的重要性(若失去了,得用 replacement,會少得幾分)。但是在實用上,每隊在每個位置可替補的球員情況不一樣。若是像目前這樣,在各個位置上,使用相同的 replacement player 成績,某隊雖然在某個位置上的球員 VORP 很高,並不代表若這球員意外受傷的話,該隊將損失慘重。因此,我們無法從現行的 VORP 中,看出該球隊是否倚賴這個球員。事實上,直接並列每個球團下,每個球員的平均每場價值(不必是 over replacement)及考慮健康下平均能出賽的場數,那就可以從相關球員間的數據,知道球隊對於每個球員的依賴程度。
看來看去,還真不知道 VORP 在哪方面上有真正實用的價值。那 VORP 為什麼會這麼紅,這麼受到廣泛使用?在這個人云亦云,趕流行,追風潮的時代,這算奇怪嗎?多少人真的知道自己在用的東西究竟有什麼功用?突然想到這次回台灣找工作,一個長輩給的意見是,演講不是要讓聽眾聽懂,反而是要把聽眾弄糊塗,才會讓人覺得你的東西玄妙高深。雖然對他的話不以為然,但不可否認,在現今的社會,這種方法很容易吃香。
引用URL
VORP把基準設定在replacement level上,比起以average level為準的好處在於,一位平均水準(或以下)的球員事實上仍然是有價值的,over replacement player的概念可以表現出這一點,除了球員打出的絕對數據之外,也考慮到球員因為其稀少性所具有的價值。在做球員的valuation的時候,我認為replacement level這個概念是很重要的。
當然可以argue說team-by-team的情形下,每一隊實際的替補球員水準不一,但如果要放大到跨隊、全聯盟或是跨年代的比較的話,VORP會是一個很好的比較基準。
VORP的起點是MLV,也就是某球員加上8個平均球員的RC,與9個平均球員的RC的差值,當然隊友不可能全為平均水準,但除非以team-by-team的方式一一套實際狀況去算,否則MLV的方法不失為簡潔又不至於失真太多的方式。
VORP計算的球員貢獻的得分,但在不同的context下,這些得分所帶來的勝場並不相同,所以在討論MVP獎項的時候,更好的方式應該是去比較WARP(wins above replacement player)或是WSAB(win shares above bench)。但VORP雖不中亦不遠矣。
我在第五段中提到,VORP 是個不錯的概念。對這樣的概念,我是贊同的。只不過在目前這樣定義下,我看不出太多的實用價值。唯一我認為會較有價值的是,當進行交易或在自由市場補人時,可以用這來判斷,錢如何花在刀口上。不過,我仍然認為,用同樣的替補球員成績,會讓 VORP 的使用,不如直接用 Value (或者你提到的 MLV)就好。不管是交易或補人,若有所有人的 value,那看跟可以輕易取得球員的 value 差,就是 VORP 的概念。但這樣做,可以直接觀察實際情況,比如是否自己小聯盟有還可以的,另外,即使是 relacement 等級的,也是有好有壞,都可以一起參考。當然,VORP 跟 MLV 也只是一個常數的差(不同位置不同常數),列出所有的 VORP 跟列出所有的 MLV,其實效果是一樣的。但這就回到我文中所問的問題,“是不是必要?”。多了 replacement 的 information 進來,並沒有多看出新的東西,那真的需要它嗎?
不過,不管 VORP 是不是有存在的必要,但我今天要質疑的是,大家把它看得太重要,什麼東西都拿它出來用。在作戰力分析時,許多人去加總 VORP 來比較戰力的作法,是有點好笑的。VORP 就得用到 RC 公式,而 RC 公式好不好,檢驗時看的就是整隊整成的成績。今天要從個人預測成績去評估該隊在新一球季的戰力,不直接計算團隊各項數據,然後帶進 RC 公式,反而個別計算後再來加總,實在是很 OOXX 的作法。
至於在 MVP 的考慮方面。VORP 是由球員的數據去估量他為球隊得了幾分,不管 WARP 或 WSAB,也是類似的方法,只是把得分換成勝場。然後,跟全隊勝場不同的差,再去分。而由球員的上壘率,長打率等去估量他對得分的貢獻,那可以算是統計上的一種迴歸結果。也就是類似,一支一壘安打平均來說對得分有多少效果(不一定要是線性的),一支全壘打,一次盜壘成功,又有多少效果,甚至不同數據間的 interaction。然而實際上,不同時候的安打,有不同的功用。不管是 clutch 或者是運氣,對已發生的事來說,打點和得分對於全隊總得分的實際影響,就是比上壘率,長打率,或 VORP 這類東西來得大。所以,若把增加球隊得分當作貢獻度,則打點加得分,是個不錯的衡量標準。若是以增加球隊勝場為標準,那應該把球隊勝利的場數,一場一場挑出來看。每一場勝利,把 1 分給對那場得分或控制失分有貢獻的球員。一個總是在球隊輸球時有好表現的球員,對增加球隊勝場是沒有什麼實際貢獻的。先從 RC 的觀念,然後轉換成勝場,再考慮 clutch 表現去補勝場差,我認為是邏輯顛倒的作法。
我個人是認為 VORP 有可能“不遠”,但卻是沒必要,因為有更直接相關的數據。
這是我的一些想法:http://www.wretch.cc/blog/andrenomo&article_id=5303676