聰明看棒球:賽伯計量學如何打破舊思維,改變棒球傳統文化(Smart Baseball: The Story Behind the Old Stats That Are Ruining the Game, the New Ones That Are Running It, and the Right Way to Think About Baseball, Keith Law )
這本是"Smart Baseball"的中譯本,個人有原文的電子書,這次藉新出中譯本之際再看一次.基本上,這是一本對理解賽伯計量學(Sabermetrics),即所謂的棒球統計學很好的入門書,它不流於單純計量公式的陳列,計算,排比,而更著重於解釋公式使用的目的,產生的發想,思維,與延革.在敘述傳統棒球數據可能隱藏的偏頗,曲解,乏力,與謎失之後,作者才開始引入講述現代棒球統計學,是如何重新看待打擊,守備,投球等等內涵,與試圖提出真正能夠有效評估上述範疇內的等序新指標.最後並加入了講述現代即時光學,雷達等測評儀器系統的引入,如pitch f/x,statcast如何更各進一步的擴大了棒球統計數據中關於選手動態範疇,與運動軌跡等等層面的測評,以便能夠有效的改善管理階層在挑選球員時的選擇精度,不會再單純的流於印象,與偶然特定年度的表現結果,而簽了一些不符效益長期爛約,以致限縮了預算的有效使用,花了大錢卻無法取得戰績上改善.
顛覆印象應該是現代棒球統計學,與本書一開始希望能夠提供的作用.在這本書裡面,依據長期資料,作者經由對比許多選手與其他同守備位置球員的數據而翻轉了一些過往對這些球員的認識,以我開始看球開始的年代來說,有兩位選手的名字比較熟悉.其中一位是游擊手Omar Vizquel,另一位是投手Kevin Brown.作者Law提出了防守數據的比較說明Omar Vizquel防守能力其實是一直被高估的,如果去查維基百科,上面寫Vizquel是因為打擊能力稍落在Ozzie Smith評價之後,但作者以Total Zone這個數據算出個別球員因為手臂幫助球隊省下的分數,加上全生涯的助殺,刺殺,與出賽場次數之比,算出此兩位游擊手的守備能力其實有相當大的差距,而我們之所以會對Vizquel會有強烈的印象記憶很多其實來自於現場轉播的主播或球評個人價值藉由口語的轉換傳播渲染而被影響的結果.另外一位則是作者以War,Fip,與ERA+等數據,搭配投球局數認爲被低估而未被選入名人堂的投手Kevin Brown,作者在舉出數據與一些入選名人堂的投手相比,此位選手生涯成績被低估,而造成這樣的原因,作者認爲是因為該名選手很有個性,與媒體相處的經歷並不愉快,因此在需要有媒體人投票的名人堂選票中自然處於不利的位置.當然本書在這個顛覆印象的選手介紹上還有許多人,很多人是早年的選手,個人不太熟,但是以上兩位則算是本地早期有轉播大聯盟比賽時,還算是留有印象的選手.其他的顛覆包括,打點,勝利打點,救援成功,勝投,盜壘成功數,關鍵時刻打者的概念這些全部被作者或現代棒球統計歸類無用的數據,甚至是害球團花大錢買進實力普普選手的兇器.
其次是改造與創新.特別是關於守備衡量上,與守備及投手兩著間的數據關係.比起打擊成績衡量的單純,守備能力的衡量在過去簡直是一塌糊塗,除了一個沒用的守備率,基本上很難真的從數據中看出什麼,這是因為守備成功這件事有高度的心證,一個沒有發生的守備就不會有失誤問題,這造成守備範圍越大,越強的選手可能因為要防守一個極端困難的狀態球沒能成功而被記失誤一次,反而守備差的選手因為眼睜睜看球從身旁飛過沒有動作,而能維持守備率於高檔.於此類似的還有充滿雜訊的ERA,拿來衡量投手也充滿著一些歸屬失分該署誰的困惑問題,也參酌著高度的守備能力混淆在其中.透過引入BABIP(batting averages allowed on balls hit into play)這種獨立於防守外的資料,看出投手的真實能力,隨後可以找出獨立投手防禦率FIP,稱為DIPS系統.守備上則有包括RF(Range Factor),FR(Fielding Run),UZR(Ultimate Zone Rating,終極防區評價),dRS(Defensive Run Saving,防守失分節省值)等新的數據來參考,而更重要其實新的儀器科技Statcast現代對於場上球員動態的測量能力,已經可以更精細的紀錄球員每一球站位,啟動,接補的能力,範疇,考量其預先判斷的數據,在守備能力的評估上,早已脫離了傳統僅靠失誤來判斷一切的過於偏誤的可能.
產業整體樣貌變動是賽博伯計量學與新的科技技術對於棒球這項運動的影響.雖然說花大錢買明星球員,收集一堆賽揚獎,銀棒獎得主確實能夠立即改善球隊的實力,但是這種花錢的不確定性,與效益持續度越來越難以掌握.一方面是當代棒球的強度增強下讓許多球員都有過度使用與訓練的可能,增加了受傷的風險,其次是現代棒球統計學帶來的新觀念讓許多球團管理層有了新的思維,開始擺脫傳統數據的束縛,從新的數據與新的科技,觀念配合下改變了一些組織建立球隊,尋找適合球員的思維模式,與新的判別準則,這些新知識與新技術帶來的效益雖然不一定就能比原先省錢,但可以提高選才組隊的準確度.另外,因為統計帶來的飛球革命,相對的也改變了球隊與賽事組成結構的內涵,比如讓打者頻繁打出滾地球型的投手越來越少,而講求直球拼球速的結果,就是投手的生命週期,使用頻率,保護的觀念下,讓許多球隊都比過往的組成增加了投手名額,減少野手數額,因此也就讓能靈活使用的工具人型的野手有了多一點的機會.它帶來的改變還包括打序的排法的改變,評估捕手能力價值方式的改變,提昇轉速彌補增速上的困難,防守佔位佈陣等等觀念,可以說棒球的樣貌早就遠不同於2000年以前,甚至2010年以前都已經與當下有所差異了.
這本書除了現代棒球的數據內容理解外,其實也能提供我們一些關於數據統計使用與研究上思路的啟發,比如War這類線性組合的新的判別數據觀念能不能以類似的概念移植到金融,財務數據上,又比如現代科技進步能將球場依照場地劃分切割成若干扇型,方位,藉此評估球員的運動防守能力,評估個別球員可能的防守分數的預期外,能不能將這樣的概念也應用在生物,醫學研究的統計上來獲得新的個體評估方式,都是我們可以從這些新的數據構成內容中引起的連串想像,所以某些方面來說,這也不是一本只是單純的棒球書,他傳達的也正是大數據革命下的一種應用領域範圍的展現成果,是可以藉此激發對其他領域數據研究的思路可能,這別是對於我來說,這是很具有意義的部分.
這本書之下還有幾本可以作為延伸閱讀的作品,如"The Hidden game of baseball","Future Value: The Battle for Baseball's Soul And How Teams Will Find The Next Superstar ", "The Book: Playing The Percentages in Baseball","Big Data Badeball: Math , Miracles and the End Of A 20-year Losing Strake","The Arm",等等,不過賽伯計量學的讀者應該是較為小眾,這些書被中文化的可能性就略低於本書,目前想看就只能看原文吧.加上因為是少數,這些書裡許多的公式名稱目前大多數並沒有約定俗成的固定中文名字,那些英文縮寫的公式名稱有時會令人感到混淆,這是閱讀這類書籍比較困擾的地方.以上.