August 11,2007

失真的 Gameday

【The Compromised Gameday】〔前言〕這篇文章,很長,也很亂,甚至可以說很無聊,且是斷斷續續又停工又趕工寫出來的,後頭甚至還有部份未完待續,但因實在拖欠太久,電腦又狀況連連,深怕若繼續延宕下去,將永無完稿之日。為了贖回自己所剩無幾的信用,決定還是把主要內容先貼出來丟臉;而累積的未回覆留言,也已逐一回應。怠慢疏誤之處,還請諸君海涵。

"When You're Right, No One Remembers;
When You're Wrong, No One Forgets!"

  說得真好,辛苦你了,查理布朗。誰說卡通裡沒有真理呢?(左圖擷取自此網頁

  正式進入這篇文章的主題前,我想先分享一下為何對 Gameday 如此感興趣的理由。以台灣球迷最關愛的投手王建民和郭泓志為例,每次賽後在休息室外接受媒體訪問時,只見記者們蜂擁而上,頻頻追問他們兩人的重點,多是對該場比賽投球內容的看法,而電視或報端的球評意見,多也集中探討類似項目,如果比賽贏了大概是這樣:「這一場狀況不錯,球很會跑、伸卡球下墜幅度夠、速球有尾勁、滑球很犀利、變速球有引誘效果……」;若是慘遭痛擊輸了球:「這一場狀況不好,球不太會跑、伸卡球太平、速球壓不下來、滑球投不進去、變速球太甜……」

  OK,我知道大家都會背了,說不定背得比王建民和郭泓志還熟練。

  當然,投手的狀況好壞,也許只有投手自己和配球接捕的捕手,最清楚投球內容是否確實掌控,但要適切地彙整描述出來,可能比要求他們投捕搭檔互換角色還困難,所以多仰賴球評或球迷自行依靠經驗來判斷。只不過,雖然投手所投出的每一球,任何人從電視轉播都可以看得很清楚,卻也只能從轉播畫面籠統地評估,缺乏完整又精確的比較基準,難以將這些模糊的「觀感」,以「定量」(球自何處進壘?尾勁多強?球速多快?測速槍真的夠準嗎?)甚至「定性」(好球/壞球,滑球/曲球,變速/指叉,傻傻分不清楚)的方式加以描述,成為投打表現的分析基礎。所幸藉由 Gameday PITCHf/x 系統,這一切都將不再只是印象與推估,而有了更明確的輪廓和邏輯,更成為刺激精彩或走味遺憾的球賽之後,另一種回味的好方法,我想這是 Gameday 系統所能提供的最大樂趣來源。


  雖然說了這麼多 Gameday 的好話,但由於New Gameday 數據所需的 PITCHf/x 系統裝置計畫,除了開季前已完成的九個球場,上半季至明星賽前幾乎毫無進展(幸好明星賽至七月底間,又多了 11 個球場裝置完成),所以儘管我們對下列與王進民相關的疑惑倍感興趣,卻也只能吹鬍子乾瞪眼:


Recent Game Log of Chien-Ming Wang

  • 06/12:2006 Cy Young Award 得主 Brandon Webb 與失主王建民,兩位滾地球投手同場競技,究竟如何各出奇招?
  • 06/17:對決大都會時曇花一現 (?) 的 10K 三振秀,到底該場的滑球、變速球投得有多好?
  • 06/23,06/28:為何這兩場狀況較不理想?被擊出全壘打的球是控球不佳還是尾勁不足呢?
  • 07/03,07/08:中指傷痛干擾下,又以什麼樣的投球策略穩住局面,力保 13 局不失分呢?
  • 07/14 ~ 07/29:據說伸卡球威力逐漸下滑,飛球比例增加,配球模式又如何演變呢?
  • 08/03:一掃七月中旬後的陰霾,漂亮取勝皇家隊,關鍵為何?
  • 08/08:大聯盟生涯最慘烈一役,慘遭多倫多藍鳥隊痛擊,2.2 局失 8 分,壞球甚至超過一半,為何控球失準頻頻失投?
  • .

  若想嚴謹地釐清上述問題,除非仔細分析每場球賽的轉播畫面,甚至像 Gameday 般逐一定量,否則我們還是只能憑前述的「觀感」,來評斷王建民在這段期間的表現。老實說,王建民表現不盡理想時,除了替他略感惋惜,其實最令我扼腕的事情是--沒有任何王建民遭痛擊時的 Gameday 數據。我當然不希望王建民被打爆,只是若剛好諸事不順烏雲罩頂,能留下可供參考對比的資訊,總比單純看完一場令人遺憾的球賽,來得更有意義。所以,前幾天的洋基 vs 藍鳥系列戰,藍鳥多倫多主場自開季以來還算正常運作的 Gameday 系統,竟剛好閉關停機銷聲匿跡,讓原本熱切期待總算能「數位化」欣賞 Roger Clemens 的指叉球威力,以及王建民與 Roy Halladay 大對決(且王進民剛好慘敗)的我,頓時也氣得想踹椅子洩憤!

  依據洋基後續賽程粗略估算,可能得等到兩週後面對 LAA 或 DET 時,才有機會再次收集王建民的 Gameday 數據。可是錯過的已經回不來了,總不能暗自期待王建民剛好再來次大失血吧,至少在下可沒這膽子干犯眾怒,但若不幸剛好發生,請大家千萬不要怪罪可能會喜孜孜的我。

  既然進一步分析王建民如此困難重重,那麼,郭泓志呢?


Recent Game Log of Hong-Chih Kuo

  除了前文已經檢視過的 06/07 祭教士換 Gameday,郭泓志後續換得的四場先發中,共有三場比賽留下 Gameday 數據:先是 06/12 首勝首轟技壓大都會,一展強投豪打雄風,意氣風發不可一世;可惜 06/20 遠航加拿大卻慘遭鳥擊,06/29 更遭來犯的教士發威反噬,然後就傳出將被球團下放 3A 磨練,直到檢驗出左手肘有發炎現象,道奇隊才將他擺入大聯盟傷兵名單,確保郭泓志「因公受傷」所應得的權益。既然有三場 Gameady 數據在手,又分別是今年郭泓志最佳和最糟的表現,就算多為郭泓志大起大落的表現和受傷感到惋惜,卻又怎麼不令人「見獵心喜」呢?然而,這些新增的 Gameday 資訊,究竟又告訴我們什麼樣的郭泓志?

  其實上述郭泓志的 Gameday 數據分析,早有幾位同好已經快手整理出來(我愛賽伯計量學b942020010的網路日誌),實無須在下多言贅述,只是關於 Gameday 缺憾的牢騷,仍有部份縈繞心頭不吐不快,因此藉由郭泓志賽事轉播為輔,較能放膽分析的 Gameday 資訊,將個人心得說明如后。


◎ 「折衷」的 Gameday (The Compromised Gameday):

  首先我們必須了解,在 Gameday 所謂的放球點 (x0, y0, z0) 座標中,只有左右 x0 與高低 z0 會隨著每一球的位置而異,至於描述飛行長度或當成起始位置的 y0 座標,其實在每場比賽中是個固定值。這當然不是因為投手們的放球距離都一致,而是因為系統的先天條件限制。為了後續討論所需,我們有必要先了解這些限制的成因。

  前文中已經稍作說明,New Gameady 採用的這套 PITCHf/x Pitch Tracking 系統,是由著名的運動轉播輔助軟體開發公司 Sportvision 公司所提供的最新產品(相較於 PITCHf/x,ESPN 的 K-Zone 只能算半套),主要利用架設於場邊賽前預作校準的高速攝影機,以每秒 60 格畫面的速率,攝得投手每一球的連續畫面,並以座標方式定出球在每一格畫面中的位置,得到該球隨時間演變的一系列三維座標,再將這些座標利用二項式回歸,運算出最貼切的飛行軌跡,便可獲知每一個維度隨時間的函數變化,從而演算出每一球的速度、變化幅度、放球點、以及進壘位置等數值。

  也就是說,Gameday 並未也無法實際測量投手真正的跨步出手點,究竟離投手板多遠(正確應說相對離本壘板多遠),而是「回歸運算」出每一個投手所投出的球,在與本壘相距 y0 英呎的固定距離時,當時的高度座標 z0、橫向座標 x0 以及對應的球速 Start_Speed 為何。之所以無法標出真正的跨步出手點,是因為每一格相鄰畫面中,球的前後位置便相距約 2 英呎,若要恰好逮到球離手的那一瞬間,機會可說是微乎其微;此外,為了避免揮臂動作造成畫面判讀干擾,攝影機的可視範圍只能力求靠近出手點,但又不能真的收錄過大的區域,也無法任意隨每一個投手或球路而調變,因此只能折衷地限縮並固定待記錄的範圍。

  儘管這樣的「固定式標速定位法」,無法量身配合每一球的實際脫手點,卻有其作業上的便利性,而且誤差也在可忽略範圍內,倒也不失為一個折衷的好辦法。球季一開始時,Gameday 採用的 y0 多定於 55 英呎,距離投手板夠近,只有約 5 英呎(約 1.5 公尺),差不多就是一般投手跨步向前甩臂脫手的位置,所以幾乎可以放心地當成實際放球點來看待。


[Fig.1] Diagram of Gameday's Pitch Trajectory Fitting by Frames Stacking in Different y0 Conditions

  只可惜,離投手如此近的測速定位點,(可能)未必適用於每個投手的投球姿勢和各種球路,相對地較容易造成判讀困難,往往使 Gameday 數據殘缺不全,而失去使用此系統的效用。(也許)有鑑於此,六月上旬起,已建置 PITCHf/x 系統的各球場,紛紛採取「更折衷」的記錄方式,便是將拍攝視界或列入計算的 y0 值範圍縮短至 40 / 45 / 50 不等,來增加 PITCHf/x 系統的判讀成功率(以上純粹是個人比較不陰謀論的想法,至於陰謀論留待後文有機會再說)。這些縮短的球道長度 y0 值,我們姑且稱之為「折衷距離」。此舉雖讓每場球賽的 Gameday 數據更完整,減少的畫面量也幾乎不會改變運算出的軌跡,也就是說繪出的球道還是一樣,只是少了真正開頭的一部份,但卻犧牲了整體資料庫的數據基準一致性,甚至根本就是一種變相的「失真」。

  也就是說,我們近期所看到的,其實只是--「失真的 Gameday」。


◎ Gameday 的球速迷思 (The Myth of Pitch Speed in Compromised Gameday):

〔說明〕此節於郭泓志獲首勝後寫就,故只有兩場間的比較,但頗適合當作範例以便解釋,段末將附上補充資訊。


[Fig.2] Start Speed Probability of Hong-Chih Kuo vs NYM, 2007/06/12 (Light Blue dots)
and Start Speed Probability of Hong-Chih Kuo vs SD, 2007/06/07 (Deep Blue dots)

  如果光看上圖中郭泓志的初速資料串,我們可能會這麼評斷:

  • 郭泓志在 06/12 vs NYM 主場先發時的球速,比 06/07 vs SD 客場登板時慢一些,無論速球或變化球,皆慢了約 3 MPH。
  • 兩場比賽的直球與變化球比例相當,直球都占七成,變化球約三成,但是 06/12 vs NYM 這場的滑球用得比較多,其次則是變速球;曲球還是一樣零星搭配,只是球速比 06/07 vs SD 時略快。

  這麼觀察大致上沒問題,似乎也和郭泓志 06/12 vs NYM 獲得首勝後的報導相近,大都覺得郭泓志為了增加控球的穩定性,而稍微降低了投球的球速。可是仔細一想,就算郭泓志刻意減少出力,或者稍微放慢揮臂動作,使球速得以減慢,理論上,只要是施力減少,球速減緩的幅度,應該隨球速不同,呈等比例縮減才是,怎會如上圖所呈現般,讓各種速度的球種,不論快慢都減少相似的份量,形成近乎等差般的結果呢?

  正因為這圖形未免太過完美,彷彿兩張描圖紙上雷同的線,橫移後一點一點相錯開,於是仔細檢視其他數據,赫然發現,原來這兩場比賽中 Gameday 所採用的放球點座標,在 Y 軸(本壘往投手方向)的位置 y0 根本就不一樣。上一場 06/07 vs SD 教士隊客場的比賽,Gameday 測量「初速」和「放球點」的位置,是距離本壘板 45 英呎 (y0 = 45);而 06/12 vs NYM 於洛杉磯道奇隊主場的記錄位置,卻是距本壘板更近的 40 英呎 (y0 = 40),也就是說,後者(06/12 vs NYM 洛杉磯主場)比前者(06/07 vs SD 教士隊主場)的記錄位置離本壘板更近,相對地便離投手出手點越遠,倘若投手的球速相當,距離本壘較近者便會量到較慢的球速。

  不僅如此,上述郭泓志兩場比賽中的「放球點」位置,都比前文分析王建民於芝加哥主場的數據測量點 y0 = 55 英呎,還要更接近本壘板。因此,我們不但無從判斷郭泓志在這兩場比賽間的球速快慢差異,更無法直接與王建民的球速作比較。幸好,我們還有其他辦法。

  雖然 Gameday 記錄「初速」的基準點不同,但畢竟所有球的飛行距離幾乎一樣,都得從投手板附近來到本壘板,而 Gameday 也在本壘板量測球進壘時的尾速 (End Speed)。由於球速相當的球飛行時,受到相近的阻力變化,也就是說具有類似的減速過程,因此我們只要比較投手在各場次或各投手間的進壘尾速,就可以判斷彼此間的球速有否明顯有別。結果如下圖:


[Fig.3] End Speed Probability Comparison - Hong-Chih Kuo vs Chien-Ming Wang

  所以,若忽略 Gameday 系統在各場地間可能存在的裝置判讀誤差,以及隨海拔高度、溼度密度、風力強弱所影響的空氣阻力變化,我們應該可以這麼判斷:

  • 郭泓志 06/12 vs NYM 洛杉磯主場出賽時的球速,其實和前一場 06/07 vs SD 於教士隊時相當;
  • 現階段王建民的速球球速,真的比郭泓志還要快!

〔補充〕郭泓志於 06/20 vs TOR 遭鳥擊、06/29 vs SD 遇教士血祭,這兩場令人遺憾的比賽中,Gameday 的「初速」記錄位置,和 06/12 技壓大都會時一樣,都是 40 英呎 (y0 = 40),我們依例將郭泓志該役的「初速」、末速數據,與先前場次一起比較,顯示 06/20 vs TOR 慘遭鳥擊、06/29 vs SD 教士反噬大佈道時,郭泓志皆未失速,球速仍維持水準,皆和 06/07 vs SD 時相當。


[Fig.4] Start / End Speed Probability Comparison - Hong-Chih Kuo


◎ Gameday 的放球點迷思 (The Myth of "Release Point" in Compromised Gameday):

  除了球速上的問題須注意之外,也由於前述四場郭泓志的比賽 Gameday 記錄裡,所謂的「放球點」y0 座標值分別是 45 或 40 英呎,這已是球離手後,來到約全程 1/5 至 1/4 的位置,球與球之間的飛行軌跡,自然較剛投出時發散,因此郭泓志的「放球點」呈現「一大圈」的現象,也就不足為奇了。上篇文章「郭泓志祭教士換 Gameday」談到郭泓志的放球點時,便因為遺漏了參考基準不同,不應與王建民的放球點相互比較,而以為郭泓志的放球點似乎不夠穩定,特此說明並向郭泓志及諸君致歉。


[Fig.5] "Release Points" & Locations of Hong-Chih Kuo's Pitches against NYM, 2007/06/12

  現在我們已經明白,郭泓志的「放球點」分布看似範圍較大,其實只是觀測位置不同所造成。就像上圖中郭泓志 06/12 vs NYM 這場比賽的控球,明顯比前次出賽好,不僅好球率提高,而且進壘位置更理想,除了速球能有效壓制,針對右打者內、外角的變化球,也有很好的搭配效果,表現相對令人讚賞,但是整體「放球點」分布還是一大圈,範圍甚至比 06/07 vs SD 還大,就是因為記錄位置更接近本壘板,整體球道軌跡更發散所導致。

  嚴格來說,這些球的位置記錄,不過是其飛行軌道離本壘 40 英呎處的截面分布罷了。諸位不妨對照一下,上圖中的速球進壘點(紅)與對應的「放球點」(深藍),以及變化球進壘點(粉紅)與對應的「放球點」(水藍),「放球點」就像進壘點的比例縮影,所以這種因「折衷」而挪後的「放球點」座標所提供的資訊,其實和進壘點差不多,彷彿在投手丘至本壘中途,擇定一處搭上棚架貼滿靶紙,我們只能藉由靶紙上的「彈孔」,得知來球穿透時的位置,根本無法協助我們進一步的分析。既然如此,我們又何必在乎這些「折衷(假)放球點」呢?

  先別急著失望,其實無須如此悲觀,雖然這些「折衷(假)放球點」位置離投手較遠,但畢竟是飛行軌道中的一點,我們還是可以利用這些「折衷(假)放球點」相關資訊,搭配對應的「進壘點」相關數據,來「反推」求得球脫手時「差不多」的位置,姑且稱之「還原放球點」。在此,我們便以 y0 = 55 英呎的距離,當作「還原放球點」的一致基準,依照下列方式來計算這些軌道收斂後的座標:

    〔「還原放球點」計算概念〕
  • 橫向座標:先將「進壘點 pX」扣除「橫向尾勁位移 pFX-X」,再與「折衷放球點」外差回溯當 y0 = 55 英呎時的 X 值。
  • 縱向座標:利用「折衷放球點」量得的途中飛行速度 VY0 與尾速 End_Speed,算出後段於 Y 軸加速度值,假設此加速度量值不變,從而算出前段所需時間,接著只考慮重力作用,便可還原當 y0 = 55 英呎時的高度 Z 值。

  詳細計算內容,姑且略過不表,至少個人認為應有相當的準確性,也曾以其他投手於「折衷距離」的資料加以驗證,確實可以大致回溯當 y0 = 55 英呎時的放球點座標。至於郭泓志的還原放球點座標計算,結果則如下列圖形所示:



[Fig.6] Traced-Back "Release Points" & Locations of Hong-Chih Kuo's "GOOD/BAD" Starts

  令人驚訝地,郭泓志經計算後的「還原放球點」,無論該場的投球表現如何,分布範圍都還算收斂,並未發現放球點散亂的情形。若同樣不考慮場地裝置誤差,以及還原計算時所忽略的初段微小偏移量,繼續比較上列各場次的「還原放球點」平均位置,儘管可以發覺如右表中郭泓志表現較差的後兩場比賽,其「還原放球點」高度,恰為最高值與最低值,卻不能貿然認為這就是影響整體球路分布的關鍵。

  諸君讀到這裡或許會感到疑惑,為何看法如此保留?且何苦執著拘泥於探究「球從哪裡來」呢?詳細原因留待後續專文『好的放球點帶你上 Gameday 天堂(暫定名)』再探討,此處暫且賣個關子。總之,此處只想以此說明,在 Gameday 的「折衷放球點」條件下,我們還是可以藉由上述方式,運用 Gameday 所收集的資訊,嘗試揭開這層遮蔽投手丘的靶紙,進而推估接近實際放球點的分布概況。


◎ Gameday 的球威迷思 (The Myth of Pitch Movement in Compromised Gameday):

  Gameday 採用「折衷距離」(y0 = 40 ~ 50) 的「失真」缺憾,除了造成「低估初速」和「錯失較確切的放球點位置」外,也折損了 New Gameday 系統的另一大特色--「尾勁偏移量 (pFX) 與軌道變化量 (Break)」的定量。在討論前,我們不妨再度回溯兩者的意義:

 pFX 和 Break 可以說是除了放球點、進壘點座標外,Gameday 最重要的核心。pFX 是指該球實際進壘點與理論拋物線(意即當球未自旋而主要受重力和初速度控制時的進壘點)相比較的位移量,可當作所謂的 Movement 來看待;而 Break 則是用來描述整體拋物線的彎曲度,定義是拋物線上與兩端點直線間的最大距離。所以簡單來說,pFX 值適合用來分析因旋轉而造成較大尾勁偏移的球種;而 Break 則是偏向描述整體飛行軌跡的彎曲度,因此適合評價變化球。

  也就是說,pFX 和 Break 可以告訴我們,投手的速球有多會「竄」,變化球到底多會「跑」,使我們無須再憑藉印象或感覺,來判斷投手的球路威力,而能夠以更精確的定量方式,顯示投手的球路如何刁鑽犀利。然而,一旦 Gameday 記錄採用「折衷距離」,這些衡量球路變化的數值,便會因為被迫忽略前段軌道的貢獻,而打上不同程度的折扣。

  我們不妨先以今年擔任明星賽美聯先發,本季表現非常突出又穩定的 Oakland 運動家隊王牌投手 Dan Haren 為例,選取他六月份前後兩場不同 y0 值的比賽(06/04 vs BOS, y0 =55;06/20 vs CIN, y0 =40)來示範,比較所記錄的 pFX 和 Break 值分布,結果變成下面這個樣子:


[Fig.7] Dan Haren's pFX-X/Z & Break Comparison between 06/04 (y0 = 55) & 06/20 (y0 = 40)

  從上圖可看出,06/20 由於採取「折衷距離 (y0 =40)」,除了球速被低估外,Dan Haren 各球種的尾勁 pFX 值,多數略微降低,分布也顯得較為收斂,若欲分辨尾勁相近的球種,將變得更為困難;也由於飛行軌道記錄被攔腰截短,變化幅度 Break 自也大幅下降,甚至只剩「正常」應能展現的一半程度,連標定球路飛行軌道最大曲率變化的 Break_Y 值,也從 06/04 時的距本壘 26 英呎,因為「折衷」後切線縮短,而變成 06/20 的 19 英呎。難道這就是傳說中所謂啥「球路較晚發生變化」(Late Break) 嗎?若 Gameday 的數據讓人因此產生誤會,豈不比這件傳說本身更加荒唐!

  雖然投手的 pFX 和 Break 值,多少會隨每次比賽的投球狀況而異,然而「折衷距離」對此兩值的影響,無論在理論或應用上,都應不難推演和發覺。只要在擁有 Gameday 系統的球隊中,挑選幾位投球內容較穩定的先發投手前後對照,例如 Cy Young Award 名投 Roy Halladay、Greg Maddux,或者新生代年輕猛將 Felix Hernandez、Daisuke Matsuzaka 等未來 CYA 的可能候選人,皆可觀察到相似的情形。但建議以主場數據衡量,以避免場地因素的可能干擾。

  話說回來,我們稍微了解「折衷距離」對 pFX 和 Break 的影響後,接下來還是別忘了得檢視郭泓志的數據,比較一下郭泓志在這四場比賽中的球路尾勁變化。顧慮到樣本比例問題,此處只針對郭泓志最主要的「四縫線速球」和「滑球」,利用盒鬚圖 (Boxplot) 的方式,來呈現郭泓志各場次球路尾勁的橫向偏移 pFX-X(圖左)與縱向偏移 pFX-Z(圖右)分布情形:


[Fig.8] Fastball Movement Boxplot of Hong-Chih Kuo's Recent Starts

    〔速球 Fastball〕(此處主要指四縫線速球)
  • 由於「折衷距離」的長短,會對尾勁判讀造成影響,因此在橫向展開比較各場數據時,需依照「折衷距離」預作分類。四場中唯獨 06/07 是 45 英呎,後三場皆為 40 英呎(紅框標記);其中 06/12 與 06/29 為洛杉磯主場,餘則為客場,上述兩點於比較數據時須特別留意。
  • 也因上列郭泓志的數據,皆受「折衷距離」所影響,無論尾勁的縱向或橫向偏移量,都應處於「稍微」被低估的狀態,尤其是郭泓志原已相當驚人的縱向偏移量 pFX-Z。令人不禁好奇,若郭泓志的球威未因「折衷」而稍打折扣,尾勁到底有多恐怖?(附帶一提,郭泓志於開季兩場 05/15、05/18 中繼出賽時,的確曾留下於 y0 = 55 英呎記錄的少數數據,只是速球的尾勁縱向偏移量,卻不及後續先發場次,即使考量熱身效應,只比較後續先發時的前二、三十球亦然。頗值得玩味。)
  • 橫向偏移 pFX-X 部份,由於非側投型的四縫線速球,於橫向的 Magnus 作用較小,數值本就偏低,因此各場間的差異並不明顯,細辨之下,頂多 06/20 於多倫多慘遭鳥擊時略微小一些;至於後三場 (y0 = 40) 和為首 06/07 (y0 = 45) 間的微小差距,或許便是「折衷距離」相距五英呎的差別。不過橫向偏移並非我們關注的焦點。
  • 縱向偏移 pFX-Z 部份,因直接對應重力和自旋 Magnus 作用,量值自然較大,若各場的投球或記錄情況有別,也較容易藉此分辨。由圖可發現,為首的 06/07 (y0 = 45) 有最高的 pFX-Z 值,後三場 (y0 = 40) 的 pFX-Z 則都降低了,雖可視為「折衷距離」縮短五英呎的效應,量值差距卻比想像中來得大,而該場對手教士隊先發 Jack Peavy 的速球 pFX-Z 也有類似情形,使人更加懷疑,前次分析過的 06/07 這場比賽,究竟是曇花一現,還是數據有誤?倘若只針對後三場相同「折衷距離」(y0 = 40) 的 pFX-Z 分布來比較,郭泓志表現不佳的後兩場比賽,pFX-Z 分布均不及 06/12,表示尾勁確有下滑跡象,此點亦可單比較同屬主場的 06/29 而確信,即使排除 06/29 幾個可能的二縫線速球,尾勁下滑的趨勢亦然。然而,尾勁下滑是否便是郭泓志表現不佳的原因呢?


[Fig.9] Slider Movement Boxplot of Hong-Chih Kuo's Recent Starts

    〔滑球 Slider〕
  • 每個投手投滑球時的揮臂角度和轉速差異,將造就不同的滑球變化風格。有的滑球同時具有顯著的縱、橫向偏移,以右投手投出的滑球為例,能同時偏離右打者的外角並有漂亮的下墜變化;有些投手則專注於滑球的橫向偏移,不過因為重力和球速之故,球路還是有一定的下墜幅度。而郭泓志的滑球,則屬於後者。
  • 橫向偏移 pFX-X 部份,是郭泓志滑球的訴求重點,各場皆維持住一定的橫向偏移量 (pFX-X: -1 ~ -3),但以 06/12 該場最佳,有較高比例的球,其橫向偏移量超過 2.5 英吋 (pFX-X < -2.5);至於表現較差的後兩場,pFX-X 其實也和先前相近。
  • 縱向偏移 pFX-Z 就比較特別了,同樣為避免「折衷距離」因素的干擾,若只比較基準相同的後三場,相當有趣的是,郭泓志後兩場的滑球,似乎稍微改變了旋轉軸,而增加了向下墜的趨勢,pFX-Z 值顯著縮水,尤其 06/20 甚至有近半是負值,表示球路比理論拋物軌跡更低。
  • 就概念推想,變化球路的尾勁變化若增加,應更具有誘騙打者的效果,也就是說,郭泓志後兩場的滑球尾勁,在維持相同的橫向偏移下,又多了縱向的下墜幅度,理當增加對打者的壓制能力。然而實際的情形又是如何呢?

  以下姑且針對本節所討論的尾勁偏移量,刻意在不考慮其他因素下,綜合比對郭泓志各場的球威差異以及對應的壓制效果。下圖便是郭泓志純因打者揮擊而成為好球(此處稱為 Hitter Strikes)的速球和滑球,於各場次的尾勁縱向、橫向偏移關係圖,並將打者未能確實掌握球路的「揮空棒(Swing Strikes,綠色圓圈)」,和相對地確實擊中形成的「安打(Hits,紅色圓圈,並以大小表示壘打數多寡)」,兩者特別標記出來,藉此呈現郭泓志的球路尾勁與打者的揮擊結果是否具有關連;並以線性迴歸線,大致呈現各場次的分布趨勢和範圍,不過此處迴歸意義有限,無須太在意。至於草色箭頭,則表示郭泓志(或泛指此類型左投)的四縫線速球與滑球尾勁之有利趨向。


[Fig.10] Pitch Result Summary Table of Hong-Chih Kuo's Recent Starts

  在樣本極為有限的情況下,大致上,速球看似符合預期,縱向尾勁較大的球雖相對安全,可是揮空率卻不見得較高,且若扣除首場異常突出表現的貢獻,就更難以判斷了;滑球部份則更令人跌破眼鏡,揮空率似和尾勁趨勢相反,若扣除基準不同的首場比賽亦然,尤其幾個往外滑又下墜的球,反而被打得特別慘。難道上述關於尾勁球威的闡釋有誤嗎?

  且慢,先別驟下評斷、質疑或解答,我們不妨再看得更細一點,將郭泓志上述各球,依其結果展開如下表(左邊是各種結果的數目,右邊則換算成百分比 %),與上圖兩相對照:


[Fig.11] Fastball & Slider Movement Diagram of Hong-Chih Kuo's Recent Starts

  是否更讓人眼花撩亂?我想也是。沒關係,我們還是把焦點擺在與尾勁球威最相關的部份,也就是打者選擇揮擊 (Swing) 的好球(最內側的藍色框)。由於這幾場比賽中,郭泓志被擊成安打的球都頗扎實,不妨依序將框內各項結果,視為球被揮擊程度遞增,以此對比球威間的差異。簡單來說,在速球部份,前兩場的郭泓志雖未讓打者頻頻揮空,還能夠有效造成出局;然而後兩場的速球後果卻很極端,一場是半數揮空,另一場則界外頻頻,但兩場都難以讓打者出局。至於滑球部份,差異更是明顯,前兩場得心應手虎虎生風,在有限的對決次數中,仍有不錯的揮空與出局數,尤以第二場 06/12 技壓大都會時為最;可是後兩場的滑球,竟像餵球般頻頻挨打,反成為拖累比賽勝負的關鍵。

  所以,我們是否可以依照上述球路尾勁與打擊結果的對照分析,藉此斷定郭泓志表現不佳是因為「速球尾勁下滑,難以令打者擊出無效球出局;而滑球變化幅度增加,反而投打者所好,因此頻遭狙擊」呢?

  不,像這樣「只知其一、不知其二」的武斷結論,當然無法說服任何人。為何不能?因為我們不應忽略以下這個關鍵,也就是和尾速一般,不受 Gameday 的失真所影響的另一項重要數據--「進壘點」。


(未完待續……)


Posted by Whither at 樂多Roodo! │17:34 │回應(13)引用(0)BASEBALL
樂多分類:運動 共同主題:棒球 工具:編輯本文
Ads by Roodo! 

引用URL

http://cgi.blog.roodo.com/trackback/3548863
回應文章
請問版大,
如你所說這些gameday系統,各球場y0各個不同
那BA、或THT上面所引的數據也多半為經調整的嚕?
Posted by reader at August 11,2007 23:15
To reader,

 Nice Question。BA、THT、甚至 BP 的相關文章中,多數的討論都忽略這個潛在問題,而把各時期場次的數據兜在一起探討,或者曾留意但掠過不表,基本上分析過程就算有疑義,但大致上瑕不掩瑜,有機會可另作討論。個人認為,開 Gameday 分析風氣之先的 Joe P. Sheehan 最為謹慎,引用數據時皆留心避免,分析也較嚴謹,不妨參考比較。
Posted by Whither at August 12,2007 01:37
剛剛我留言時好像伺福氣不穩, 再留一次。

關於y0, MLB數據部扛霸子Cory Schwartz在這部分語焉不詳, 一點都沒有解釋到, 我個人把他當作arbitrary constant。

不是要挑剔, 不過以Dan Haren兩場先發拿來分析y0對球速跟尾勁的影響樣本數似乎有點小。 而且以scouting report和他實戰表現來看, 他對Boston那場測速槍有點快樂, 因為他4-seamer大多投到low 90s。
Posted by 小弟姓黑名貓 at August 12,2007 09:06
To 小弟姓黑名貓,

 感謝熱情回應。您所指應是 Cory Schwartz 於 05/09 在「Everything You Ever Wanted To Know About Gameday」Q&A 中的答覆吧 (I saw your suggestion too. But I think we both prefer it\'s free for everybody. ^_^)。其實那樣的解釋,主要是從實務角度說明目前 Gameday 關於放球點的逼近方式,就像拙文中所描述般,那是沒辦法中的辦法。只能說他的回答有些避重就輕就是了。當成 arbitrary constant 的確也無妨,只是不應忽略 Gameday 如此取捨的用意,太 arbitrary 的話,如上所言,系統的諸般優點只會更加失色。

 基本上,文中所提及的失真缺憾,都無涉樣本數大小,純就理論即可確信。This is beyond question. 而 Gameday 或說 PITCHf/x 所標記的球速,是依照多項式曲線回歸運算出來的,並非使用雷達測速槍。若照 Cory Schwartz 或 Sportvision 的官方說法,目前的座標定位能精確至 1/2 英吋的偏差,那麼個人覺得 New Gameday 的球速資料會比測速槍來得可靠。Dan Haren 對紅襪那場球的確很快樂,但那應是他頑強對抗的心情,而非 Gameday 資料中不存在的快樂槍。至於 Gameday 的投手球速初速若比 scouting report 習慣的測速槍數據來得快,也是很合理的,純粹是先天條件問題,可參考 The Hardball Times 作者 John Beamer 此篇文章:【Zoooomaya and speed guns】,其實比 Under the Skin 那篇有意思。
Posted by Whither at August 17,2007 21:32
我一開始讀這篇文章也是這樣想的, 可是之後我想起我之前開的xml檔案裡面, 有的一場比賽裡面y0變來變去, 並不是一個固定數字, 讓人不禁懷疑: 難道程式在比賽途中特意變換在不同的y0取樣? 我覺得不大可能, 所以判斷y0為arbitrary constant應該合理。

還有, 在這沒有批評的意思, 因為沒有海豚大你的大作的話我也不會寫blog。 不過"純就理論即可確信"這句話可就有點違反科學精神了。 像我們都知道打者對跟4-seamer比起來, sinker的揮空率較低, 但是Andrenomo仍是蒐集了足夠樣本的gameday資料投稿到The Hardball Time去證明了這個論點。 You might think otherwise, but i think this is why Andre is awesome.

至於Dan Haren嘛...或許有可能對紅襪會讓他鬥志上揚, 但是他在Fenway的split卻不是這麼顯示。 的確clutch pitching比clutch hitting較有可能, 但錯誤發生的可能性還是存在的, 不論儀器有多精良, 所以樣本數的大小是很重要的。
Posted by 小弟姓黑名貓 at August 18,2007 15:42
To 小弟姓黑名貓,

 再次感謝賜教。前些天我曾修改「折衷的 Gameday」一節,刪掉原先易造成誤解的不當舉例, 重新簡單描述 Gameday PITCHf/x 系統的運作與換算原則,或許您重讀過該節,就會更明白 y0 可隨需要或目的而變動的可能原因。簡單來說,Gameday PITCHf/x 系統,能將高速攝影機拍攝的各格畫面,以座標方式定出球在每一格中的位置,然後以多項式迴歸逼近來描述球的飛行軌道。因此我們只要給定任意 y0 值,帶入得到的多項式,便可求得對應的 x0, z0 座標。若欲逼近投手的實際放球點,也只需讓 y0 值夠大即可,例如 Gameday 一開始所採用的 y0 = 55 英呎。

 回到尾勁偏移量 pFX 被低估這個問題,我還是必須這麼說:「This is beyond question.」,也無須增加樣本來驗證,因為這個問題牽涉的層面,並非仰賴積累數據供後續解析的 Sabermetrics 或其源頭的 Statistics,而是理論模型即可解釋的 Physics 或其分支 Dynamics。

 為避免文字敘述流於空談或造成誤解,我只好將理論推演概念,繪製成下面這張圖形:


  我們以單一維度(高度 Z 軸),來看一個因自旋而使落點比預估軌道高 (pFX-Z>0) 的快速球,其 pFX-Z 在不同的折衷距離 y0 間有何差異:(可先參考前文回應中關於 pFX-Z 值的相關演算


  • 「紅色實線」是球的實際飛行軌跡,「綠色虛線」是於 y0 = 55 處開始預估的未自旋軌跡,「粉紅虛線」則是從 y0 = 40 處才開始預估的未自旋軌跡。

  • 先看當 y0 = 55 時的情形:由於速球的自旋 Magnus 作用會減緩下墜趨勢,因此未考慮自旋作用的預估軌道「綠色虛線」,在過程中都會比實際飛行軌跡「紅色實線」為低。兩條線在本壘板前的高度差便是 pFX-Z55

  • 若縮短折衷距離為 y0 = 40:從 y0 = 40 開始預估未自旋軌跡「粉紅虛線」,須憑藉當時高度 Z0 (40)和切線速度 V40,若暫不記入「粉紅虛線」起點高度 Z0 (40) 和「綠色虛線」於 y0 = 40 處的高度差(亦即前段 15 英呎累積的偏移量),即便假設兩線位居同一高度,由於「粉紅虛線」以實際飛行軌跡於該處的切線速度 V40 為初速,由兩者的向量方向即可確知,「粉紅虛線」的整體軌跡將比「綠色虛線」略高,若加計起始處的微小高度差,整體輪廓就更清楚了。當然兩個未自旋虛線都低於實際軌跡「紅色實線」,pFX-Z 都會是正值,只是由折衷距離 y0 = 40 開始評估的 pFX-Z 40,會小於原來 y0 = 55 所算得的 pFX-Z 55

  • 若將切線速度拆解成 Y, Z 軸分量,就更容易理解了。由於繞 X 軸自旋不影響 Y 軸上的速度分量,因此 V40, y = Vn40, y,兩條虛線將同時到達本壘,只是因為 Z 軸分量 V40, z < Vn40, z,在同樣的力學作用下,Z 軸初速小的「粉紅虛線」自然比「綠色虛線」高,因此 pFX-Z 40 < pFX-Z 55

  • 因為拙文中是以不同 y0 值的兩場比賽,來對比呈現 pFX 值被低估的結果,或許才導致沒必要的樣本迷思。其實應該這麼強調,同一個球路軌跡的 pFX,會因對應多長的折衷距離 y0 而受影響,但由於 Gameday 中並無同一顆球於不同 y0 處演算成的 pFX 可供比較,故拙文中只好建議,以單一投手、單一場地,揀選不同折衷距離的比賽,作為pFX 因折衷距離而失真的勉強示範。

 上述演證對反向自旋的曲球 (pFX-Z<0) 同樣適用,結果還是一樣,折衷距離縮短將造成 pFX-Z 值被低估,當然曲球的 pFX-Z 還是負數,只是絕對值減小。至於 X 軸的橫向偏移 pFX-X,原理也一樣。既然這只是單純的力學應用,自然和樣本數量無涉,希望上述的說明有助釐清此觀念。因此,在下並不認為「純就理論即可確信」這句話有什麼問題。就讓賽伯的歸賽伯,牛頓的歸牛頓吧。

 至於「像我們都知道打者對跟4-seamer比起來,sinker的揮空率較低……」,這是依經驗法則形成的推測,因此 Andre 才要想辦法整理分析,嘗試以數據檢驗這個推測。若加上 Chris Constancio 關於進壘點的歸納分析「Why do sinking fastballs cause groundballs?」,將會呈現更完整的樣貌。Andre is awesome,那當然很好,但請恕我不明白為何自己需要高攀看齊。海豚大之稱實在折煞人,在下不過是一個單純的爵士愛好者,偶而抒發隨棒球起伏的胡思雜感,自得其樂,如此罷了。

 「不論儀器有多精良,錯誤發生的可能性還是存在的」當然毋庸置疑,相信誰都同意。只是 Dan Haren 該場球賽的數據,整體而言沒啥異樣,即使單就球速部份而言,也不算特殊,為避免折衷距離干擾,下圖只比較 Dan Haren 相鄰主場賽事的速球末速。個人認為倒無須特別質疑。


 希望上述說明,還算無愧科學精神。感謝您願花時間閱讀拙作並發聲討論,這是在下的榮幸,還請多多指教。
Posted by Whither at August 18,2007 22:54
你搞錯了, 我舉Andre出來不是說你應該向他學習, 也不是說賽伯怎樣的比其他棒球迷優秀。 請容許我從頭解釋:

4-seamer比sinker較易揮空可以用物理和生理學解釋, 大抵是4-seamer因magnus effect導致球的下降幅度比人腦中預期的降落幅度小, 所以打者有一種球會上升的錯覺, 揮空機會會增加。

當然, 若以純粹的理論模型來解釋, 說到這邊即可。 但實際上Andre仍是蒐集了資料證明了這東西。 "解釋"跟"證明"兩者對於闡述自身論點都是很重要的。 我對你"解釋"這方面是沒疑問的, 但"證明"這方面之前則是略有困惑。

若因Andre is awesome造成你任何不快在此我先道歉,我無意宣揚說賽伯是王道, 或把我個人跟他連在一起 。
Posted by 小弟姓黑名貓 at August 19,2007 06:45
To 小弟姓黑名貓,

 言重了,您無須致歉,能像這樣理性討論,針對棒球這項迷人的共同興趣,釐清疑惑增進了解,這是非常寶貴的機會與經驗。再次向您致謝。

 賽伯計量學 (Sabermetrics) 雖未必是王道,但至少是一種「以嚴謹態度努力探究棒球數據深化分析基礎以便趨近王道」的系統化工具。Sabermetrics is awesome. 任何服膺科學態度關心棒球數據的人,相信都會愛上賽伯計量學才是。還有許多地方得向諸位多學習,也請不吝提點指教。
Posted by Whither at August 21,2007 19:55
Whither兄:
要保重身體啊(連回應都這樣搞會很累吧>.
Posted by IBIZA at August 22,2007 17:51
來,放自己一個假,去聽『艾多‧羅曼諾』三重奏吧
(手笨眼盲抱歉留兩則,但還是很想催票一下)
Posted by IBIZA at August 22,2007 17:54
To IBIZA,

 多謝叮嚀。至今時時謹記,能打字是件很幸福的事。諸位也要趁年輕多保重身體。

 其實能像這樣彼此分享,我覺得是件非常棒的事情,也多虧如此才更費心補充,所以並不覺得累人。更何況,有訪客願意賞臉發聲質詢,總比沒人回應好多了。

(IBIZA 君另則留言,請恕在下轉至「2007 兩廳院夏日爵士派對」一文中回應,應較適切些。)
Posted by Whither at August 23,2007 14:45

「未完待續」很久了…:P
Posted by Jack at April 11,2009 17:56

To Jack,

 「看來這是位新朋友,竟然不知道懶散店老闆 Whither 惡名昭彰的壞習慣。」老闆娘說。

 Whither:「……」
Posted by Whither at April 13,2009 23:37