鷹旗百夫長2015-03-26 04:20:00
注:本文譯自英國著名新聞雜志周刊《經濟學人》。
足球世界中的對立和競爭也許會隨著時間而消弭,但是任何俱樂部之間的對決都比不了巴薩和皇馬,這對西班牙足壇的兩大巨人之間所能引發的激烈爭奪。
3月22日,通過一場2-1的勝利,巴薩將他們與排名第二的皇馬之間的分差從1分擴大到了4分;在另一場幾乎是勢均力敵的爭奪中,皇馬的頭牌C羅憑借第31分鐘的得分,在射手榜上以31球緊追排名第一的巴薩球星梅西。
自從羅納爾多在2009年以創紀錄的8000萬英鎊(1.3億美元)的身價空降馬德里,這兩位被廣泛認可為當時最杰出的體育明星也終于得到了面對面交手的機會,而且是每年至少兩次。不過,兩人的交鋒趨勢是此消彼長,不分勝負的:從2009年到2012年,梅西連續四年榮膺由國際足聯頒發的金球獎;不過在過去兩年,羅納爾多連續掄元——事實上,隱藏在這種榮譽易主現象背后的秘密就在于:在一項以進球為硬通貨的體育運動中,羅納爾多先生在2013和2014年的“賬戶”要比梅西先生充盈一些。
然而,并不是所有的進球都有著相等的價值,只有對應到具體的情況和背景之中,這些數據的價值才能夠得到體現。如果一場比賽在第90分鐘的時候還是1-1,那么此時此刻的進球就將成為勝利天平上的關鍵砝碼;而同樣在比賽的這個時間點,有的進球到來比分早已3-1領先。
一般的推測認為,進球價值取決于進球頻率。但是實際上,衡量個體進球價值正確的辦法應該是以其進球的時間和頻率共同作為考量。推而廣之,我們的那些金球獎評委,或者說那些以進球數為評審依據的各方,在過去似乎都犯了些錯誤。以梅西為例,即使在他表現“一般”的過去兩年,巴薩從他的86個進球中得到的相對收益,也要多于C羅的105球給皇馬帶來的好處。
【計算進球價值的統計學公式】
如果我們以進球的發生背景為參照衡量為進球加以權重,從統計學上我們將這種統計學模型稱之為“預期得分增加值”(Expected Points Added),簡稱EPA,這是一種由“獲勝概率增加值”(Win Probability Added ,最早應用于棒球)的統計框架發展而來一種現實應用。
通過收集和研究從2001-2013年的超過4000粒英超進球,數據分析網站SoccerStatistically.com 提供了一個小的程序,只要在比賽進行中的任意時間點其中輸入比賽場地、剩余時間以及兩隊的進球差數,程序就可以提供本場比賽的勝平負概率。而在比賽過程中,每當有進球發生時,在這個程序輸入即使數據,就可以看到這個進球對于比賽結果影響力的大小。
以上面提到的兩種情況為例,當某個扳平比分的進球發生在第90分鐘,主隊勝平負的可能性分別為11%、82%和8%,此時按照統計學模型公式,勝則乘3,平乘1,負乘0,那么他們的的預期分值(expected points,簡稱EP)為1.13EP。而如果此時這個進球幫助球隊取得了領先,那么主隊勝利的可能性就是95%,平的幾率則是5%,那么主隊的預期分值就是2.89EP。在這兩個分值之間的差距是1.76,這就是“預期得分增長值”(下文以EPA代指)。而在另一種情況下,如果此時主隊已經兩球領先,那么此時主隊勝率就是99.7%,平的概率為0.3%,而此時的EPA值就只有0.007,這個錦上添花的進球比起之前的那個值(1.76)相比就差了250倍。
【那點球怎么算?】
如果需要對這個模型做一個必要的調整,那就是點球。如果一支球隊一旦在禁區犯規,那么他們的對手的預期得分將隨之增加:具體方式就是單一進球的EPA值乘以本聯賽的點球轉換率(從09-10賽季,西甲的點球平均成功率為78%);如果這名球員打進點球,那么他的得分值就是這個點球的預期增長值×(100%-平均點球轉化率);而如果他罰失,則要被懲罰扣除這粒點球分值的78%。
很復雜?那我們來舉個例子:今年3月1日皇馬主場和比利亞雷亞爾的比賽中,在比賽第52分鐘的時候,皇馬還未進球,此時他們的預期分值為1.60EP。這個時候,比利亞雷亞爾禁區內犯規,皇馬擁有78%的可能打進點球,而這將使得他們的預期分值增長至2.46EP,增長值為0.86。C羅成功罰進點球,此時他的EPA值便是0.86×(100%-78%)=0.19。
而如果我們來看2月24日,巴薩與曼城的歐冠1/8決賽首回合,梅西在補時階段得到點球機會,當時比分為2-1客隊領先。此時巴薩的預期分值由2.90上升至了2.98,如果梅西罰進點球,那么他的EPA值就是0.08×(100%-78%)=0.018。但是眾所周知,梅西罰丟了,所以此時巴薩的預期分值就由2.98降至2.90,而梅西收到的懲罰就是0.08×78%=0.06.
【所以計算結果是……】
那么問題來了,如果我們把這兩位巨星在2013和2014年各項賽事,包括聯賽、歐冠和國家隊的每一個進球逐一分析,會是什么結果呢?
分析數據顯示,羅納爾多先生的優勢經過統計模型的計算蕩然無存。C羅在過去兩年的105個進球最終只為皇馬和葡萄牙國家隊貢獻了41.6EP值,平均每球的EPA值則為0.40。雖然他在上賽季歐冠半決賽和決賽的三粒進球成為他獲評金球獎的重要依據,但是從統計學角度看,這不過只是數據的堆積。面對拜仁的兩粒進球全部發生在皇馬已經總比分3-0領先的時候,這兩粒進球的EPA總和為0.29;而在決賽,他打進的點球僅僅是皇馬在3-1領先之后的錦上添花之作,貢獻的EPA值更是微不足道的0.004。
而相對應,梅西在過去兩年一共打進86球,為國家隊和俱樂部貢獻40.3EP值,平均每球的EPA值則達到了0.47。很多進球都具有很高的價值。在2013-2014年,梅西有五次在最后20分鐘打進決定勝負局面的進球。換句話說,阿根廷人在絕對進球數上20%的劣勢(86:105)被他在進球重要性上20%的優勢(0.47:0.40)所彌補。
【其實,對手不同,進球價值也不同】
事實上,即使是這個統計學模型也無法完全公正地展示梅西在進球時機上超群的一面:進球發生時間很重要,但是進球的場合也同樣重要。梅西的進球,尤其是制勝球,很多都集中在巴薩過去兩年的關鍵戰役中。
或許沒有很合適的衡量比賽重要性的方法——只有最鐵桿的俱樂部球迷才會認為聯賽冠軍要比歐冠世界杯更有分量,但是誰又能說清楚世界杯到底有多大的價值呢?一個可能的方式便是電視收視率。利用來自英國的現有數據,然后通過考慮英格蘭的球隊是否在比賽,以及比賽轉播是通過信號塔還是衛星信號,歐冠比賽的收視率大致是國內聯賽收視率的三倍,而世界杯的收視率則是至少4.7倍,決賽階段更是達到了15.2倍。而國家德比,在很多人看來向來是價值6分的必爭之戰,因為獲勝者在拿到3分的同時也讓自己的直接競爭對手丟掉了3分。
只要把這個情況考慮進去,我們才能完整地看到梅西表現的過人之處:如果我們將比賽的重要性加入模型,那么梅西在過去兩年所有進球的加權EPA值則是59.5,平均每球0.69;而C羅的總值為50.4,平均每球0.48。
如果單獨以EPA值作為參考,那么梅西在過去兩年最重要的進球發生在一座中立球場的第91分鐘,不過對手并不是來自西甲的一些魚腩,而是世界杯小組賽第二場和伊朗的比賽。那場比賽的收視率加權為4.7。而在對陣尼日利亞的比賽中,梅西兩次超出比分。
相比較之下,C羅在世界杯上只有一個進球。對陣加納C羅打入一球,雖然這里進球確實是決定了比賽的勝負,但是也顯得微不足道。因為葡萄牙當時需要一場4球大勝才可能力壓美國出線,但是葡萄牙人的努力并沒有阻止自己的國家隊早早被淘汰。如果我們從這角度看這場比賽,C羅的EPA值還要下降到43.6,比梅西足足低了27%(43.6:59.5)。
【淡定,統計學結果只代表進球價值,不代表球員能力】
梅西的球迷需要注意的一點是,這個分析不能被過度解讀。因為首先,足球并不只有進球,他還需要防守,而這個模型是完全沒有考慮防守這個因素的。而且即使是在進攻領域,也還有著其他的方面,比如傳球,吸引對方后衛防守,為隊友制造空間,與把球送進球門相比,這些技巧同樣重要。
而且,即使僅僅是討論進球本身,這些數據也不能完全證明梅西比C羅在得分能力上更勝一籌。因為縱觀體育世界,運動員事實上很難像加了離合器一樣,在關鍵時刻自如地調整自我狀態。如果我們將調查的樣本擴大到足夠大,我們會發現運動員們在重要比賽中的平均表現事實上就代表了他們的正常水平,只是有的人在湊巧會表現得超常一些,而有的人則會失常——但是這種離散的情況永遠不會超出變量的可預期值。
圖:《經濟學人》根據統計學模型制作出的C羅與梅西在過去兩年的進球數以及進球權重對比
即使是最好的預測設備,當用它們對C羅和梅西在關鍵比賽、關鍵時刻(比如國家德比或者一場必勝之戰的最后關頭)進行預測的時候,這些人工智能所給出的結果也不過是基于過去幾年梅西C羅的平均表現,最多加入球員本人即時身體狀況數值以及對手實力作為參考。
盡管只是作為一個單純回顧性的研究和測量,本文依然可以從統計學的角度證明:所謂“梅西在經歷職業生涯低谷的兩年之后重回個人進球巔峰”的說法是錯誤的。不僅僅是2015年,梅西同時還是2014、2013兩年,乃至從2009-2012年全世界最為舉足輕重的射手。
當然金球獎的評委們在投票時,可能是受了“梅西審美疲勞”的影響——但是對于巴薩和阿根廷的球迷來講,很顯然,這完全不是問題。
版權聲明:本文來自互聯網整理發布,如有侵權,聯系刪除
原文鏈接:http://www.freetextsend.comhttp://www.freetextsend.com/tiyuzhishi/17368.html