若想嚴謹地釐清上述問題,除非仔細分析每場球賽的轉播畫面,甚至像 Gameday 般逐一定量,否則我們還是只能憑前述的「觀感」,來評斷王建民在這段期間的表現。老實說,王建民表現不盡理想時,除了替他略感惋惜,其實最令我扼腕的事情是--沒有任何王建民遭痛擊時的 Gameday 數據。我當然不希望王建民被打爆,只是若剛好諸事不順烏雲罩頂,能留下可供參考對比的資訊,總比單純看完一場令人遺憾的球賽,來得更有意義。所以,前幾天的洋基 vs 藍鳥系列戰,藍鳥多倫多主場自開季以來還算正常運作的 Gameday 系統,竟剛好閉關停機銷聲匿跡,讓原本熱切期待總算能「數位化」欣賞 Roger Clemens 的指叉球威力,以及王建民與 Roy Halladay 大對決(且王進民剛好慘敗)的我,頓時也氣得想踹椅子洩憤!
依據洋基後續賽程粗略估算,可能得等到兩週後面對 LAA 或 DET 時,才有機會再次收集王建民的 Gameday 數據。可是錯過的已經回不來了,總不能暗自期待王建民剛好再來次大失血吧,至少在下可沒這膽子干犯眾怒,但若不幸剛好發生,請大家千萬不要怪罪可能會喜孜孜的我。
[Fig.2] Start Speed Probability of Hong-Chih Kuo vs NYM, 2007/06/12 (Light Blue dots) and Start Speed Probability of Hong-Chih Kuo vs SD, 2007/06/07 (Deep Blue dots)
如果光看上圖中郭泓志的初速資料串,我們可能會這麼評斷:
郭泓志在 06/12 vs NYM 主場先發時的球速,比 06/07 vs SD 客場登板時慢一些,無論速球或變化球,皆慢了約 3 MPH。
兩場比賽的直球與變化球比例相當,直球都占七成,變化球約三成,但是 06/12 vs NYM 這場的滑球用得比較多,其次則是變速球;曲球還是一樣零星搭配,只是球速比 06/07 vs SD 時略快。
這麼觀察大致上沒問題,似乎也和郭泓志 06/12 vs NYM 獲得首勝後的報導相近,大都覺得郭泓志為了增加控球的穩定性,而稍微降低了投球的球速。可是仔細一想,就算郭泓志刻意減少出力,或者稍微放慢揮臂動作,使球速得以減慢,理論上,只要是施力減少,球速減緩的幅度,應該隨球速不同,呈等比例縮減才是,怎會如上圖所呈現般,讓各種速度的球種,不論快慢都減少相似的份量,形成近乎等差般的結果呢?
正因為這圖形未免太過完美,彷彿兩張描圖紙上雷同的線,橫移後一點一點相錯開,於是仔細檢視其他數據,赫然發現,原來這兩場比賽中 Gameday 所採用的放球點座標,在 Y 軸(本壘往投手方向)的位置 y0 根本就不一樣。上一場 06/07 vs SD 教士隊客場的比賽,Gameday 測量「初速」和「放球點」的位置,是距離本壘板 45 英呎 (y0 = 45);而 06/12 vs NYM 於洛杉磯道奇隊主場的記錄位置,卻是距本壘板更近的 40 英呎 (y0 = 40),也就是說,後者(06/12 vs NYM 洛杉磯主場)比前者(06/07 vs SD 教士隊主場)的記錄位置離本壘板更近,相對地便離投手出手點越遠,倘若投手的球速相當,距離本壘較近者便會量到較慢的球速。
郭泓志 06/12 vs NYM 洛杉磯主場出賽時的球速,其實和前一場 06/07 vs SD 於教士隊時相當;
現階段王建民的速球球速,真的比郭泓志還要快!
〔補充〕郭泓志於 06/20 vs TOR 遭鳥擊、06/29 vs SD 遇教士血祭,這兩場令人遺憾的比賽中,Gameday 的「初速」記錄位置,和 06/12 技壓大都會時一樣,都是 40 英呎 (y0 = 40),我們依例將郭泓志該役的「初速」、末速數據,與先前場次一起比較,顯示 06/20 vs TOR 慘遭鳥擊、06/29 vs SD 教士反噬大佈道時,郭泓志皆未失速,球速仍維持水準,皆和 06/07 vs SD 時相當。
[Fig.4] Start / End Speed Probability Comparison - Hong-Chih Kuo
◎ Gameday 的放球點迷思 (The Myth of "Release Point" in Compromised Gameday):
[Fig.5] "Release Points" & Locations of Hong-Chih Kuo's Pitches against NYM, 2007/06/12
現在我們已經明白,郭泓志的「放球點」分布看似範圍較大,其實只是觀測位置不同所造成。就像上圖中郭泓志 06/12 vs NYM 這場比賽的控球,明顯比前次出賽好,不僅好球率提高,而且進壘位置更理想,除了速球能有效壓制,針對右打者內、外角的變化球,也有很好的搭配效果,表現相對令人讚賞,但是整體「放球點」分布還是一大圈,範圍甚至比 06/07 vs SD 還大,就是因為記錄位置更接近本壘板,整體球道軌跡更發散所導致。
我們不妨先以今年擔任明星賽美聯先發,本季表現非常突出又穩定的 Oakland 運動家隊王牌投手 Dan Haren 為例,選取他六月份前後兩場不同 y0 值的比賽(06/04 vs BOS, y0 =55;06/20 vs CIN, y0 =40)來示範,比較所記錄的 pFX 和 Break 值分布,結果變成下面這個樣子:
[Fig.7] Dan Haren's pFX-X/Z & Break Comparison between 06/04 (y0 = 55) & 06/20 (y0 = 40)
雖然投手的 pFX 和 Break 值,多少會隨每次比賽的投球狀況而異,然而「折衷距離」對此兩值的影響,無論在理論或應用上,都應不難推演和發覺。只要在擁有 Gameday 系統的球隊中,挑選幾位投球內容較穩定的先發投手前後對照,例如 Cy Young Award 名投 Roy Halladay、Greg Maddux,或者新生代年輕猛將 Felix Hernandez、Daisuke Matsuzaka 等未來 CYA 的可能候選人,皆可觀察到相似的情形。但建議以主場數據衡量,以避免場地因素的可能干擾。
Nice Question。BA、THT、甚至 BP 的相關文章中,多數的討論都忽略這個潛在問題,而把各時期場次的數據兜在一起探討,或者曾留意但掠過不表,基本上分析過程就算有疑義,但大致上瑕不掩瑜,有機會可另作討論。個人認為,開 Gameday 分析風氣之先的 Joe P. Sheehan 最為謹慎,引用數據時皆留心避免,分析也較嚴謹,不妨參考比較。
感謝熱情回應。您所指應是 Cory Schwartz 於 05/09 在「Everything You Ever Wanted To Know About Gameday」Q&A 中的答覆吧 (I saw your suggestion too. But I think we both prefer it\'s free for everybody. ^_^)。其實那樣的解釋,主要是從實務角度說明目前 Gameday 關於放球點的逼近方式,就像拙文中所描述般,那是沒辦法中的辦法。只能說他的回答有些避重就輕就是了。當成 arbitrary constant 的確也無妨,只是不應忽略 Gameday 如此取捨的用意,太 arbitrary 的話,如上所言,系統的諸般優點只會更加失色。
基本上,文中所提及的失真缺憾,都無涉樣本數大小,純就理論即可確信。This is beyond question. 而 Gameday 或說 PITCHf/x 所標記的球速,是依照多項式曲線回歸運算出來的,並非使用雷達測速槍。若照 Cory Schwartz 或 Sportvision 的官方說法,目前的座標定位能精確至 1/2 英吋的偏差,那麼個人覺得 New Gameday 的球速資料會比測速槍來得可靠。Dan Haren 對紅襪那場球的確很快樂,但那應是他頑強對抗的心情,而非 Gameday 資料中不存在的快樂槍。至於 Gameday 的投手球速初速若比 scouting report 習慣的測速槍數據來得快,也是很合理的,純粹是先天條件問題,可參考 The Hardball Times 作者 John Beamer 此篇文章:【Zoooomaya and speed guns】,其實比 Under the Skin 那篇有意思。
還有, 在這沒有批評的意思, 因為沒有海豚大你的大作的話我也不會寫blog。 不過"純就理論即可確信"這句話可就有點違反科學精神了。 像我們都知道打者對跟4-seamer比起來, sinker的揮空率較低, 但是Andrenomo仍是蒐集了足夠樣本的gameday資料投稿到The Hardball Time去證明了這個論點。 You might think otherwise, but i think this is why Andre is awesome.
若將切線速度拆解成 Y, Z 軸分量,就更容易理解了。由於繞 X 軸自旋不影響 Y 軸上的速度分量,因此 V40, y = Vn40, y,兩條虛線將同時到達本壘,只是因為 Z 軸分量 V40, z < Vn40, z,在同樣的力學作用下,Z 軸初速小的「粉紅虛線」自然比「綠色虛線」高,因此 pFX-Z 40 < pFX-Z 55。
上述演證對反向自旋的曲球 (pFX-Z<0) 同樣適用,結果還是一樣,折衷距離縮短將造成 pFX-Z 值被低估,當然曲球的 pFX-Z 還是負數,只是絕對值減小。至於 X 軸的橫向偏移 pFX-X,原理也一樣。既然這只是單純的力學應用,自然和樣本數量無涉,希望上述的說明有助釐清此觀念。因此,在下並不認為「純就理論即可確信」這句話有什麼問題。就讓賽伯的歸賽伯,牛頓的歸牛頓吧。
至於「像我們都知道打者對跟4-seamer比起來,sinker的揮空率較低……」,這是依經驗法則形成的推測,因此 Andre 才要想辦法整理分析,嘗試以數據檢驗這個推測。若加上 Chris Constancio 關於進壘點的歸納分析「Why do sinking fastballs cause groundballs?」,將會呈現更完整的樣貌。Andre is awesome,那當然很好,但請恕我不明白為何自己需要高攀看齊。海豚大之稱實在折煞人,在下不過是一個單純的爵士愛好者,偶而抒發隨棒球起伏的胡思雜感,自得其樂,如此罷了。
「不論儀器有多精良,錯誤發生的可能性還是存在的」當然毋庸置疑,相信誰都同意。只是 Dan Haren 該場球賽的數據,整體而言沒啥異樣,即使單就球速部份而言,也不算特殊,為避免折衷距離干擾,下圖只比較 Dan Haren 相鄰主場賽事的速球末速。個人認為倒無須特別質疑。