419 回国,点球的博弈论-《壹掌遮天》


    第(3/3)页

    该理论的大致含义是:在一场零和博弈中(译注:又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能),双方具有完美信息(译注:所谓完美信息,指轮到行动的局中人知道先前的行动的其他局中人采取了什么策略,比如在2016年的百年美洲杯决赛中,布拉沃知道梅西之前所做的决策),两方可以采取相应的对策来使自己的损失减到最小。

    当考虑自己可以采用的每一个策略时,一方必须考虑到在自己采用一种策略时,对方有可能采取的所有反应。

    双方需要考虑的是“最差条件下,能得到的最好结果”,即在博弈过程中,看对方提出决策后自己的最低收益是多少;然后在这些最低收益里找到最大的那个。

    实证检验这样一个定理是非常困难的,但是罚点球情境却是研究极小极大定理的理想素材。

    点球博弈是典型的零和博弈,点球主罚者的得益和门将的得益一定是相对的(即不存在点球主罚者与对方门将共赢的可能)。

    伦敦经济学院经管策略学教授兼毕尔巴鄂竞技足球俱乐部人才甄别中心负责人伊格纳西奥·维尔塔对此进行了一个很有参考价值的研究。

    点球博弈模型可以如此展开分析:在一场点球博弈中,双方的得益都是比赛的胜利——主罚者需要踢进点球,守门员需要扑出点球。我们假定主罚者可以将球踢向左侧或右侧,相对应的,守门员也可以做出向左或是向右的扑救动作。双方还有一种选择是主罚者将球踢向中路,守门员留守中路,但我们随后将会分析这种情况在统计学上意义不大,所以我们维持向左或向右的假定。当然主罚者完全有可能将球踢出球门范围以外,我们在这里不予考虑。

    π在这里代表一个特定的事件,πLR代表的是主罚者将球踢向自己左侧,而守门员扑向主罚者右侧的情况。在事实层面表现为守门员完全扑错了方向。

    我们必须清楚一点:双方的动作是同时做出的——有研究表明,球从踢球者脚下到球门线只需要大概0.3秒的时间,这意味着守门员不可能等到球被踢出,看到球的运行轨迹后再做出成功扑救。

    这意味着主罚者和守门员必须同时选择他们的策略。

    维尔塔教授经过研究,表明点球博弈在如下情况时,能够达到一种与众不同的纳什均衡(译注:又称为非合作博弈均衡,以约翰·纳什命名,如果某情况下无一参与者可以独自行动而增加收益则此策略组合被称为纳什均衡)。

    在上述模型中,想要达到纳什均衡,主罚者和守门员需要采取策略组合。

    上述均衡能够产生两个可预测的实验结果。我们提出了一个“成功率”的概念——点球主罚者和守门员的成功概率应该是一样的。

    主罚者和守门员在点球过程中的选择必须相互独立。

    简而言之,双方必须只关心当时的得益而不考虑过往的点球经历——双方的选择必须基于无记忆条件下的。

    换句话说,在对于一个现时点球的决策过程中,双方都不能被之前的经验所影响。

    其实道理很简单,作为点球主罚者或是守门员,如果对方预先知道你的选择,那么形势对自己将相当不利。所以对于两方来说,比较理想的情况是双方各自随机挑选策略组合,并且无法从对方的策略组合中牟利。

    维埃塔教授用经典假设方法与真实数据来检定上述两个假设是否成立。数据来自于西班牙、英格兰、意大利以及一些国际比赛,时间限定在1995年9月到2012年6月。

    数据的规模达到了总共9017次点球,同时被记录下来的数据还包括:球员的名字(包括点球主罚者和守门员各自的名字),比赛双方球队的名字,比赛日期,点球主罚者将球踢出的方向(自己的左侧、右侧或是中路),主罚点球的时间点,主罚点球前的双方比分,比赛的最终结果,点球是否罚进(未罚进的情况包括被守门员扑救、偏出或者踢中门柱或横梁),上述每一项数据都清晰地分成类别。


    第(3/3)页