Go with the hot hand.

——篮球爱好者的一句口头禅

在返朴3月的文章《那个曾经随时可能失明的少年,刚刚获得数学界最高荣誉》中,有一道用于展示概率是如何反直觉的思考题:

假设稍后要掷硬币100 次——可以给出一系列正面(H)和反面(T)的序列。

现在你有选择权,可以选择积分规则。

规则A:对于序列中的每个HH,你都会得到一分;对于每个HT,对手都会得一分。

规则B:反过来,对于序列中的每个HH,对手都会得到一分;对于每个HT,则你得一分。

比如说序列片段HHHT,按A规则就是你得2分,对手1分。

问:为了积分高于对手,你应该选择哪条规则?又或者说,两条规则的获胜概率是一样的?

在文末,笔者指出答案是B。因为HH和HT的数学期望虽然是一样的,但是得分分布不同。此时前者过于集中(3个H得2分),导致它的胜率变低。

从各平台的评论区反馈来看,很多读者朋友对这个结果抱持怀疑的态度。这其实是可以理解的。

3月18日,多伦多大学的数学系助理教授丹尼尔·利特(Daniel Litt)在社交平台X(原twitter)上发布了一则投票贴,其内容正是上面那个问题。在短短2天的时间里,这个投票获得了百万浏览和近500的转评。要知道,丹尼尔并不是什么网红,他平时会和一些数学爱好者或同行互动,分享一些相对硬核的数学内容——也就是绝大多数网友丝毫不想看的内容。所以,他的帖子通常只有个位数的转评,而这一贴的热度之高完全出人意料。

在参与转发和讨论的人中,有图灵奖得主杨立昆(Yann LeCun),金融概率科学畅销书《黑天鹅》的作者纳西姆·尼古拉斯·塔勒布(Nassim Nicholas Taleb)等知名学者。很多人都给出了自己的分析。

24小时后投票人数已达5万,虽然仅有10%的人答对。

多伦多大学数学系助理教授Daniel Litt发起的概率问题投票截图|图源:littmath@twitter.com。

我们当然可以为这个概率问题奉上严密的数学论证,但恐怕这也不是大多数读者“想看”的内容。况且,如此埋没这个问题的现实背景,实在是大煞风景!毕竟,用NBA和NCAA赛场上球员的状态来理解数学模型,要形象具体得多,也更有趣。

《黑天鹅》的作者纳西姆·尼古拉斯·塔勒布编程模拟硬币投掷结果|图源:nntaleb @twitter.com

“疯狂三月”和热手效应

4月9日,NCAA“疯狂三月”全美锦标赛决赛,康涅狄格大学以75:60大胜普渡大学。康涅狄格大学的篮球校队6次打入NCAA决赛,6次夺冠!

NCAA(全国大学体育协会)是由美国和加拿大一千多所大学院校参与的体育运动协会。它举办各种体育项目的联赛,包括篮球、橄榄球、棒球、冰球、田径、体操、摔跤等。其中,最受关注的是NCAA男子篮球一级锦标赛,这项赛事每年3月举行,通常称为“疯狂三月”。该赛事吸引了大量观众和运动员,成为美国大学生最重要的盛会之一。包括NBA在内的赛事直播,都会避开疯狂三月里的重要赛事。国内也有非常多的球迷每年追看这一赛事。

许多球迷一定还记得斯蒂芬·库里(Stephen Curry)在2008年NCAA上的超人表现:他带领弱旅戴维森学院(Davidson College)取得胜利,同时在下半场几乎以一己之力击败了强大的冈萨加(Gonzaga)队。成就年轻库里的,是他的技术、运气,还是那天他有什么特别之处?

几乎每个篮球运动员、教练或球迷都认为,一些球员有一种不可思议的热手效应(hot-hand effect)——有人认为那就是现在更为出名的ZONE状态或心流状态。

热手,基本上是说,球员会进入一种特殊的状态;在这种状态下,他们的个人球技和视野达到顶峰,投篮如有神助。历史上像克雷格·霍奇斯(Craig Hodges)连续命中19个三分球,或已成为金州勇士队控球后卫的斯蒂芬·库里在练习中连续投中105个三分球,篮球评论员通常会将其归因于“手感来了”,“手热起来了”。

用一些NBA球员的说法:你意识到,你的身体是协调的,你的思想是专注的,你情绪是自信的——因此成功是不可避免的,把球投入篮筐,简直毫不费力。

然而,甚至就在NCAA的官方网站上,长久以来对热手效应的解释是:并不存在。那只是一种错觉,因为我们作为人类有一种把随机性片段当作是内在模式的倾向。事实上,在过去的30年里,研究行为和决策的科学家一直持有这种观点。

不久前刚刚去世的诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)曾直言:“热手效应是一种巨大而普遍的认知错觉。”

丹尼尔·卡尼曼被誉为行为经济学之父,他的畅销著作《思考,快与慢》是引领无数人反思自身的决策方法和思考方式的启蒙读物。像卡尼曼这样声名卓著的学者绝非信口开河之人,他的论断来自心理学家托马斯·吉洛维奇(Thomas Gilovich)、罗伯特·瓦隆(Robert Vallone)和阿莫斯·特沃斯基(Amos Tversky)在1985年发表的具有里程碑意义的论文《篮球赛中的热手:关于随机序列的误解》[1]。这篇论文有时以三位作者的姓氏首字母GVT指代。

在研究NCAA历史上的投篮数据时,GVT发现,投篮命中和未中的出现次序与反复掷硬币看到的正面和反面的顺序一样,是无法区分的。

就像赌徒在掷硬币时偶尔会出现连续的正面一样,篮球运动员在投篮时也会偶尔连中。GVT得出的结论是,热手是一种“认知错觉”;人们倾向于在随机性中“识别出”规律,将完全典型的随机现象视为非随机现象。

从此,学术界将热手效应定性为“热手谬误”。

更重要的是,GVT发现,职业从业者(NBA球员和教练)不仅是认知错觉的受害者,而且他们对热手的信念是顽固的。在NBA的关键比赛里,教练和球员倾向于把投球机会让给看起来手热的球员。

GVT的结果对心理学家和经济学家如何思考信息决策产生了深远的影响。随着GVT的结果被外推到篮球以外的领域,热手谬误成为一种文化模因。从金融投资到电子竞技,均有所反映。

但,真的如此么?

NBA球员的场上表现与条件概率

无论科学家如何说,大多数篮球球迷一直相信热手效应,这甚至反映在《NBA嘉年华》(NBA Jam)等电子游戏中。在游戏里,如果玩家控制球员连续多次投篮入筐,球上就会带着火焰。

当俱乐部雇佣的运动科学顾问向球员和教练讲解GVT的研究结论时,很多球员都选择无视。波士顿凯尔特人队传奇教练、“红衣主教”阿诺德·雅各布·奥尔巴赫(Red Auerbach)有句名言:“这个人(GVT)是谁?他做了个研究,但我不在乎。”

学术界的反对意见同样强烈,但特沃斯基和吉洛维奇成功地捍卫了他们的论点,同时指出了反对他们的论文里所存在的严重缺陷。所以,之后虽仍存在一些孤立的质疑者,但GVT的结果已被当作是科学界(但非篮球界)的共识。

这种情况直到2017年才发生了变化,当时一篇开创性的论文[2]显示,GVT的经典研究——以及后来基于它的研究——存在小而显著的选择偏差,从而影响了统计结果。基本上,研究团队在寻找连胜或热手现象时选择样本的方式使他们的数学模型无效。当研究人员考虑把偏差纳入计算时,热手效应就应该是存在的。当球员变得炙手可“热”时,他们是场上不可忽视的力量。

两名信息科学、运营和决策技术领域的研究员——博科尼大学(Bocconi University)决策科学系副教授约书亚·米勒(Joshua Miller)和阿利坎特大学(The University of Alicante)经济学副教授亚当·桑朱尔乔(Adam Sanjurjo)重新审视了GVT的概率模型,发现后者做了一个隐含的假设,即如果每个球员的100次投篮结果的序列是由掷硬币决定的,则他们连续得分能力的统计数据也必然遵循同样的分布。

令人惊讶的是,这种直觉上显然的预设前提是不正确的。注意,就是在这里,篮球比赛和卷首那个概率问题联系到了一起!

米勒和桑朱尔乔认为,为热手效应构建数学模型,对应的不仅是随机投掷硬币得到的正(H,对应投篮命中)、反(T,对应投篮未中)序列,还要考虑正正(HH,连续得分,有手热征兆)和正反(HT,得分后再投未中)。然而就像笔者一直在强调的,HH和HT的概率虽然是相同的,但前者出现的时候更加集中!这一事实导致GVT的论证失效了。

完整的论证可以在参考文献[2]中找到,该论文可在线获取。在这里的推理应用了所谓的限制选择原则,该原则出现在桥牌中,并且是新信息更新信念的标准数学程序——即贝叶斯推理——背后的直觉理念。米勒两人的结果与各种概率谜题和统计偏差联系起来,问题的最简单版本几乎等同于著名的蒙提霍尔三门问题(Monty Hall problem),后者曾难倒了著名的数学家保罗·埃尔德什(Paul Erdős)和许多其他聪明人。

本文的目的恰好与米勒和桑朱尔乔两人的目标相悖。他们两人当初是为热手效应寻找一个数学模型,而我们则是为了解答最开始的思考题,为数学模型寻找一个可以直观理解它的现实场景!所以,我们现在就可以用NBA球星的表现来解读原始问题的答案为何是B。

如果一个NBA球员状态起伏不定,手热的时候(随机手热,无法控制)一场可以砍下80分,但是手不热时,得分就变成了个位数;同时他的队友的场均得分和他相当,但是每场得分的上下波动在5分以内,那么实际上他对队伍的贡献不如每场得分更均匀的队友。

原题里的规则A,就是一个运气好的时候可以拿到极高分的“选手”。这个选手在某几场比赛里,以高比分碾压对手,但如果只看平均得分的话,他和对手得分相当,而对手每次获胜又都是以微弱优势胜出,那就说明一个“赛季”下来,规则A输多赢少。

所以,选择规则A,获胜的时候有高几率是大比分获胜,拿到了70或80分,但是实际上只要拿到50分就足够了。更多的得分相当于浪费掉了。选择规则B,最高也仅仅是50分,所以规则B每次获胜的时候,得分更加均匀。反复玩这个游戏(每次游戏投掷100次硬币),选B获胜的次数会更多。

极客网站煎蛋网的ID为vevan的网友在CodePen在线社区上分享了用于模拟这个问题的代码段[5],每次运行模拟10万次游戏。可以看到,HH胜出46k次左右,HT胜出48k左右。规则B略占优。

米勒也参与了对原题的讨论,并给出了一个直观解释。| 图源:jben0@twitter.com

热手效应的影响

对热手效应的研究,不仅仅关乎NBA和篮球比赛本身——虽然NBA也是价值百亿美元的大生意——它还关乎信息行为决策以及统计学工具在现实世界里的正确应用。

康涅狄格大学的经济学副教授雷米·莱文(Remy Levin)对米勒和桑朱尔乔的这篇论文评价极高:“非常精彩,是我每年在行为学教学中最喜欢讲授的内容之一。超级有趣、反直觉的有限样本结果,对条件概率的测量实践有重大影响。同时,这也是我最喜欢的科学成果之一。”

现在让我们回到GVT的数据。GVT将投篮分为连续三次(或更多)得分和连续三次(或更多)投篮未中,并比较了各类数据的分布。由于米勒两人指出了一个令人惊讶的数学结论(也是我们的思考题!),他们发现,历史数据里连续投篮得分后,下一投也能得分的概率比人们预期的高出11个百分点!

在连续命中时,投篮准确率相对提升11个百分点是不容忽视的。事实上,这大致等于NBA中平均得分手和最佳三分射手之间的投篮命中率差异。因此,与最初发现的结果相比,GVT的数据揭示了实质性的、具有统计学意义的热手效应!

更重要的是,支持热手效应的证据并不唯一。事实上,在最近的研究中,我们发现这种效应在NBA三分球大赛中以及在其他对照研究中得到了体现。其他研究人员使用罚球和比赛数据进一步佐证了这一点。此外,由于另一个被称为“测量误差”的微妙统计问题,热手效应很有可能比我们估计的更重要。

热手效应背后的机制无疑是十分复杂的。有研究发现,类似于安慰剂效应,如果球员自己不相信热手效应,则他就难以获得超出平时的手感。

2022年的研究[3]进一步指出,手热并不意味着球员可以突然从球场上的任何地方投篮。对NBA的球员来说,手热看起来就像是在比赛中发现了一个可以利用的漏洞——可能是一个更矮的球员在防守他们——并通过采取更多某种类型的投篮来利用漏洞。

虽然这个假设是合理的,但它可能也不是导致手热的唯一因素。短期神经可塑性——玩家大脑快速适应游戏条件的能力——会是一个原因吗?专注力和心理准备呢?不管是什么原因,现有研究提供了强有力的证据来支持热手效应的存在。

因此,令人惊讶的是,那些NBA球星的经验实际上一直都是正确的。今天,NCAA的官方网站已经删除了那个把热手效应归于认知谬误的网页。

参考资料:

[1]The hot hand in basketball: On the misperception of random sequences – ScienceDirect

[2] Surprised by the Gambler’s and Hot Hand Fallacies? A Truth in the Law of Small Numbers by Joshua B. Miller, Adam Sanjurjo:SSRN

[3] The hot hand in the wild | PLOS ONE

[4]OSF Preprints | Surprised by the Hot Hand Fallacy? A Truth in the Law of Small Numbers

Momentum isn’t magic – vindicating the hot hand with the mathematics of streaks (theconversation.com)

[5] https://codepen.io/lunar-dark/pen/NWmpKpM

[6] The Hot Hand and Its Effect on the NBA: arXiv:2010.15943

本文受科普中国·星空计划项目扶持

出品:中国科协科普部

监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司


本文来自微信公众号:返朴 (ID:fanpu2019),作者:嘉伟

Source

Visited 1 times, 1 visit(s) today
Subscribe
Notify of
guest
0 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x