本篇文章1610字,读完约4分钟
雷锋。网站:alex bleakley,本文原作者,徐宇文翻译,校对:王玉森。这篇文章是雷锋发表的。经大数据文摘授权(搜索“雷锋”。com "公共号码)。如果您需要转载,请联系授权。
在今天凌晨结束的世界预赛亚洲12强第四场比赛中,中国队以0比2负于乌兹别克斯坦队,第四场比赛后只得了1分。赛后,国家足球队教练高洪波在新闻发布会上宣布辞职。
摘要
有人说,当一个足球队刚刚得分时,他们会突然变得比以前更容易被对方得分。这种说法可靠吗?这种现象与主客场、球队实力等因素有关吗?
英国作家亚历克斯·布莱克利通过数据分析研究了这一现象:他分析了2015-2016年英超联赛的数据,将前一个进球后10分钟内的进球数与同一联赛所有比赛中10分钟内的进球数进行了比较,得出了一个有趣的结论:尽管两队在进球后5分钟内再次得分很困难,但失球队在进球后5分钟内得分。
上周,我们通过比较前一个进球后10分钟内的进球数和同一联赛中所有比赛在同一10分钟内的进球数,研究了进球是否倾向于成对出现。
我们还考虑了每支球队的实力差异以及主客场因素,以便在离开特定球队的基础上更准确地计算出预期的进球数量。
这项研究将提出这种可能性。如果我们先回答一个问题:是得分者还是得分者更有可能被对手得分,我们可以预测在一些比赛中会有更多的进球。
我们的数据中有三个主要因素可以用来预测足球队在特定比赛中的进球数量:
主场比赛还是客场比赛;
该队的平均得分;
对手平均失球数。
我们通过观察一个联赛中的所有比赛来收集上述三个因素的数据。为了量化主客场比赛的优势,我们通过计算主客场球队每场比赛的平均进球数与整个赛季所有比赛中所有球队的平均进球数之比来量化主客场比赛的优势因素。
例如,在2015-2016赛季的英超联赛中,这些因素是:
同样,我们通过观察失球/失球与全联盟平均水平的比率来计算球队的进攻力量系数和防守力量系数。例如,曼城俱乐部在2015-2016赛季的因素有:
最后,因为球队不是在和他们自己比赛,所以数学模型要求我们对这些因素的值做一些细微的调整,以避免高估目标的数量。
解决方法是用一个修正因子来除预测的进球数,这个修正因子是为每个被检查的联赛单独计算的,在1.002和1.004之间。
通过对目标的分布和三个主要因素的独立性做一些常规的假设,我们可以用下面的公式来计算主队在给定的5分钟内的预期目标。
类似地,我们可以通过用客场实力因数替换主场实力因数来计算客场球队的预期目标数。
接下来,我们可以通过平均图表中的所有目标来绘制一些类似的表格,但这一次是在考虑团队实力的基础上:
图表1:2015-2016赛季欧洲大联盟进球后10分钟内再次得分的实际值和期望值之间的比较,考虑了主客场实力的差异
然而,一旦我们考虑到竞争团队的实力,在进球后5-10分钟内再次得分的次数仅增加5%。因此,基于这个图表,我们在提出“目标的增加与第一个目标直接相关”的判断时需要更加谨慎。
然而,如果把上面的图片分成刚刚进球的队和刚刚失球的队,我们会得到一些更有趣的结论。
图表2:2015-2016赛季欧洲大联盟进球后10分钟内再次得分的实际值和期望值之间的比较,考虑主客场实力的差异,根据进球队和失球队进行划分。
这些表格表明,尽管两队在进球后5分钟内再次得分很困难,但在进球后5分钟内,失球的可能性相对提高了,但进球队却没有。下图通过每分钟的记录将这一事实形象化:
图表3:2015-2016赛季欧洲六大联赛中每分钟的预期进球数和实际进球数之间的百分比差异根据进球团队和进球团队来划分
当然,这一事实并不一定意味着如果曼城对阵桑德兰并取得进球,桑德兰现在比曼城更有可能取得下一个进球。但这意味着桑德兰比以前更有可能进球,但曼城不会。
因此,如果球队管理层警告你,你必须在进球后10分钟内保持充分的警惕,这个建议可能真的很有用,因为数据也是这样说的。