鹰旗百夫长2015-03-26 04:20:00
注:本文译自英国著名新闻杂志周刊《经济学人》。
足球世界中的对立和竞争也许会随着时间而消弭,但是任何俱乐部之间的对决都比不了巴萨和皇马,这对西班牙足坛的两大巨人之间所能引发的激烈争夺。
3月22日,通过一场2-1的胜利,巴萨将他们与排名第二的皇马之间的分差从1分扩大到了4分;在另一场几乎是势均力敌的争夺中,皇马的头牌C罗凭借第31分钟的得分,在射手榜上以31球紧追排名第一的巴萨球星梅西。
自从罗纳尔多在2009年以创纪录的8000万英镑(1.3亿美元)的身价空降马德里,这两位被广泛认可为当时最杰出的体育明星也终于得到了面对面交手的机会,而且是每年至少两次。不过,两人的交锋趋势是此消彼长,不分胜负的:从2009年到2012年,梅西连续四年荣膺由国际足联颁发的金球奖;不过在过去两年,罗纳尔多连续抡元——事实上,隐藏在这种荣誉易主现象背后的秘密就在于:在一项以进球为硬通货的体育运动中,罗纳尔多先生在2013和2014年的“账户”要比梅西先生充盈一些。
然而,并不是所有的进球都有着相等的价值,只有对应到具体的情况和背景之中,这些数据的价值才能够得到体现。如果一场比赛在第90分钟的时候还是1-1,那么此时此刻的进球就将成为胜利天平上的关键砝码;而同样在比赛的这个时间点,有的进球到来比分早已3-1领先。
一般的推测认为,进球价值取决于进球频率。但是实际上,衡量个体进球价值正确的办法应该是以其进球的时间和频率共同作为考量。推而广之,我们的那些金球奖评委,或者说那些以进球数为评审依据的各方,在过去似乎都犯了些错误。以梅西为例,即使在他表现“一般”的过去两年,巴萨从他的86个进球中得到的相对收益,也要多于C罗的105球给皇马带来的好处。
【计算进球价值的统计学公式】
如果我们以进球的发生背景为参照衡量为进球加以权重,从统计学上我们将这种统计学模型称之为“预期得分增加值”(Expected Points Added),简称EPA,这是一种由“获胜概率增加值”(Win Probability Added ,最早应用于棒球)的统计框架发展而来一种现实应用。
通过收集和研究从2001-2013年的超过4000粒英超进球,数据分析网站SoccerStatistically.com 提供了一个小的程序,只要在比赛进行中的任意时间点其中输入比赛场地、剩余时间以及两队的进球差数,程序就可以提供本场比赛的胜平负概率。而在比赛过程中,每当有进球发生时,在这个程序输入即使数据,就可以看到这个进球对于比赛结果影响力的大小。
以上面提到的两种情况为例,当某个扳平比分的进球发生在第90分钟,主队胜平负的可能性分别为11%、82%和8%,此时按照统计学模型公式,胜则乘3,平乘1,负乘0,那么他们的的预期分值(expected points,简称EP)为1.13EP。而如果此时这个进球帮助球队取得了领先,那么主队胜利的可能性就是95%,平的几率则是5%,那么主队的预期分值就是2.89EP。在这两个分值之间的差距是1.76,这就是“预期得分增长值”(下文以EPA代指)。而在另一种情况下,如果此时主队已经两球领先,那么此时主队胜率就是99.7%,平的概率为0.3%,而此时的EPA值就只有0.007,这个锦上添花的进球比起之前的那个值(1.76)相比就差了250倍。
【那点球怎么算?】
如果需要对这个模型做一个必要的调整,那就是点球。如果一支球队一旦在禁区犯规,那么他们的对手的预期得分将随之增加:具体方式就是单一进球的EPA值乘以本联赛的点球转换率(从09-10赛季,西甲的点球平均成功率为78%);如果这名球员打进点球,那么他的得分值就是这个点球的预期增长值×(100%-平均点球转化率);而如果他罚失,则要被惩罚扣除这粒点球分值的78%。
很复杂?那我们来举个例子:今年3月1日皇马主场和比利亚雷亚尔的比赛中,在比赛第52分钟的时候,皇马还未进球,此时他们的预期分值为1.60EP。这个时候,比利亚雷亚尔禁区内犯规,皇马拥有78%的可能打进点球,而这将使得他们的预期分值增长至2.46EP,增长值为0.86。C罗成功罚进点球,此时他的EPA值便是0.86×(100%-78%)=0.19。
而如果我们来看2月24日,巴萨与曼城的欧冠1/8决赛首回合,梅西在补时阶段得到点球机会,当时比分为2-1客队领先。此时巴萨的预期分值由2.90上升至了2.98,如果梅西罚进点球,那么他的EPA值就是0.08×(100%-78%)=0.018。但是众所周知,梅西罚丢了,所以此时巴萨的预期分值就由2.98降至2.90,而梅西收到的惩罚就是0.08×78%=0.06.
【所以计算结果是……】
那么问题来了,如果我们把这两位巨星在2013和2014年各项赛事,包括联赛、欧冠和国家队的每一个进球逐一分析,会是什么结果呢?
分析数据显示,罗纳尔多先生的优势经过统计模型的计算荡然无存。C罗在过去两年的105个进球最终只为皇马和葡萄牙国家队贡献了41.6EP值,平均每球的EPA值则为0.40。虽然他在上赛季欧冠半决赛和决赛的三粒进球成为他获评金球奖的重要依据,但是从统计学角度看,这不过只是数据的堆积。面对拜仁的两粒进球全部发生在皇马已经总比分3-0领先的时候,这两粒进球的EPA总和为0.29;而在决赛,他打进的点球仅仅是皇马在3-1领先之后的锦上添花之作,贡献的EPA值更是微不足道的0.004。
而相对应,梅西在过去两年一共打进86球,为国家队和俱乐部贡献40.3EP值,平均每球的EPA值则达到了0.47。很多进球都具有很高的价值。在2013-2014年,梅西有五次在最后20分钟打进决定胜负局面的进球。换句话说,阿根廷人在绝对进球数上20%的劣势(86:105)被他在进球重要性上20%的优势(0.47:0.40)所弥补。
【其实,对手不同,进球价值也不同】
事实上,即使是这个统计学模型也无法完全公正地展示梅西在进球时机上超群的一面:进球发生时间很重要,但是进球的场合也同样重要。梅西的进球,尤其是制胜球,很多都集中在巴萨过去两年的关键战役中。
或许没有很合适的衡量比赛重要性的方法——只有最铁杆的俱乐部球迷才会认为联赛冠军要比欧冠世界杯更有分量,但是谁又能说清楚世界杯到底有多大的价值呢?一个可能的方式便是电视收视率。利用来自英国的现有数据,然后通过考虑英格兰的球队是否在比赛,以及比赛转播是通过信号塔还是卫星信号,欧冠比赛的收视率大致是国内联赛收视率的三倍,而世界杯的收视率则是至少4.7倍,决赛阶段更是达到了15.2倍。而国家德比,在很多人看来向来是价值6分的必争之战,因为获胜者在拿到3分的同时也让自己的直接竞争对手丢掉了3分。
只要把这个情况考虑进去,我们才能完整地看到梅西表现的过人之处:如果我们将比赛的重要性加入模型,那么梅西在过去两年所有进球的加权EPA值则是59.5,平均每球0.69;而C罗的总值为50.4,平均每球0.48。
如果单独以EPA值作为参考,那么梅西在过去两年最重要的进球发生在一座中立球场的第91分钟,不过对手并不是来自西甲的一些鱼腩,而是世界杯小组赛第二场和伊朗的比赛。那场比赛的收视率加权为4.7。而在对阵尼日利亚的比赛中,梅西两次超出比分。
相比较之下,C罗在世界杯上只有一个进球。对阵加纳C罗打入一球,虽然这里进球确实是决定了比赛的胜负,但是也显得微不足道。因为葡萄牙当时需要一场4球大胜才可能力压美国出线,但是葡萄牙人的努力并没有阻止自己的国家队早早被淘汰。如果我们从这角度看这场比赛,C罗的EPA值还要下降到43.6,比梅西足足低了27%(43.6:59.5)。
【淡定,统计学结果只代表进球价值,不代表球员能力】
梅西的球迷需要注意的一点是,这个分析不能被过度解读。因为首先,足球并不只有进球,他还需要防守,而这个模型是完全没有考虑防守这个因素的。而且即使是在进攻领域,也还有着其他的方面,比如传球,吸引对方后卫防守,为队友制造空间,与把球送进球门相比,这些技巧同样重要。
而且,即使仅仅是讨论进球本身,这些数据也不能完全证明梅西比C罗在得分能力上更胜一筹。因为纵观体育世界,运动员事实上很难像加了离合器一样,在关键时刻自如地调整自我状态。如果我们将调查的样本扩大到足够大,我们会发现运动员们在重要比赛中的平均表现事实上就代表了他们的正常水平,只是有的人在凑巧会表现得超常一些,而有的人则会失常——但是这种离散的情况永远不会超出变量的可预期值。
图:《经济学人》根据统计学模型制作出的C罗与梅西在过去两年的进球数以及进球权重对比
即使是最好的预测设备,当用它们对C罗和梅西在关键比赛、关键时刻(比如国家德比或者一场必胜之战的最后关头)进行预测的时候,这些人工智能所给出的结果也不过是基于过去几年梅西C罗的平均表现,最多加入球员本人即时身体状况数值以及对手实力作为参考。
尽管只是作为一个单纯回顾性的研究和测量,本文依然可以从统计学的角度证明:所谓“梅西在经历职业生涯低谷的两年之后重回个人进球巅峰”的说法是错误的。不仅仅是2015年,梅西同时还是2014、2013两年,乃至从2009-2012年全世界最为举足轻重的射手。
当然金球奖的评委们在投票时,可能是受了“梅西审美疲劳”的影响——但是对于巴萨和阿根廷的球迷来讲,很显然,这完全不是问题。
版权声明:本文来自互联网整理发布,如有侵权,联系删除
原文链接:https://www.yigezhs.comhttps://www.yigezhs.com/tiyuzhishi/17368.html