

"重复是学习之母。"这句话几乎是所有人从小接受的教育信条。
但2026年2月,加州大学旧金山分校(UCSF)神经科学家维杰·莫汉·南布迪里团队在《自然·神经科学》上发表了一项研究,给这个百年信条打上了一个大问号。他们的结论简洁而令人不安:在联想学习中,真正决定学习效率的,不是你重复了多少次,而是两次奖励之间隔了多长时间。
这不是对"间隔效应"的老调重弹,而是一条此前从未被精确测量过的新规律。
越少越快,数字颠覆直觉
实验设计本身并不复杂。研究团队让101只口渴的小鼠接受经典条件反射训练,先播放一段短促的音频信号,随即提供加糖水作为奖励。关键的变量只有一个:两次配对之间的时间间隔。
一组小鼠每60秒经历一次声音加奖励,另一组则需要等待600秒,也就是整整10分钟。
按照沿用一个多世纪的逻辑,前一组理应学得更快,因为它们在同样的时间里积累了更多次配对体验。但实验结果完全相反。间隔600秒的小鼠,建立声音与糖水之间关联所需的配对次数,仅为间隔60秒那组的十分之一左右。两组小鼠达到相同学习水平所花的总时间几乎一样,但一组只需要少得多的尝试次数。
南布迪里在接受媒体采访时说:"联想学习与其说是'练习出真知',不如说是'时机决定一切'。"
研究团队随后使用光纤光度法实时追踪了小鼠伏隔核(大脑奖赏处理的核心区域)中多巴胺的释放情况。多巴胺是一种与愉悦、动机和学习密切相关的神经递质,在条件反射形成过程中,大脑会逐渐学会在听到音调时就提前释放多巴胺,而非等到实际获得糖水时才反应。这种"多巴胺反应前移",是大脑建立预测关联的生化标志。
测量结果与行为数据高度吻合。间隔更长的小鼠,在更少的尝试次数后,就出现了稳定的多巴胺前移反应,而且这种反应出现的时间,甚至早于小鼠开始用舔舐动作表现出期待行为。
换句话说,大脑的化学层面变化,比行为层面的变化更早到来,也更精确地遵循了这条时间比例规律。
从尼古丁到AI,这条规律指向哪里
研究团队设计了多组对照实验,逐一排除干扰因素。他们测试了"每日获得奖励总量减少"是否才是真正的变量,在这种情况下,糖水的稀缺性或许会让小鼠更敏感。他们也测试了"在实验室待更长时间本身"是否会带来影响。所有对照结果都指向同一个结论:决定学习速率的,是奖励之间的时间间隔,而非其他因素。
他们还把实验扩展到厌恶学习领域,用声音配合轻微的足部电击替代糖水。相同的比例规律再次出现,电击间隔越长,小鼠建立恐惧关联所需的试验次数越少。这说明,这一规律不局限于"甜蜜的奖励",而是适用于大脑建立预期这一更普遍的机制。
部分强化实验的结果同样引人深思。研究团队将音调播放间隔保持在60秒,但只在10%到50%的时间里给予糖水。由于实际奖励出现的有效间隔被大幅拉长,小鼠同样只需更少的奖励次数就完成了学习,即使在没有糖水的试次中,多巴胺反应依然提前出现并趋于稳定。
这一发现对理解成瘾行为提供了一个新的解释框架。尼古丁依赖的形成,正是通过环境线索与间歇性、不规律的奖励反复配对实现的。如果大脑确实从稀少、间隔较长的奖励中提取更多的学习信息,那么间歇性强化的成瘾性就有了更清晰的神经生物学解释。南布迪里团队据此推测,尼古丁贴片这类持续释放药物之所以对部分患者有效,原因之一可能正是它打断了特定环境线索与奖励之间的配对节律,从而削弱了触发渴望的关联强度。
南布迪里还指出了这一发现对人工智能领域的潜在启示。当前大多数强化学习系统依赖海量交互来积累微小的参数更新,本质上仍遵循"重复次数越多效果越好"的旧逻辑。如果把时间间隔的比例规律引入AI学习算法的设计,理论上可以让模型从更少的样本中提取更多的信息。他直言,"目前,人类大脑的学习速度仍然远快于我们的机器,而这项研究帮助解释了为什么。"
这项研究的局限也很清晰。全部实验都在受控条件下的小鼠身上完成,人类的学习情境远比实验室复杂,奖励可以是抽象的、延迟的、社会性的,刺激也往往是多元而模糊的。比例缩放规律在极端间隔条件下也会失效。下一步,团队将探索大脑中究竟哪个具体区域负责计时,并测试这一规律是否同样适用于药物奖励。
但至少有一件事,已经被101只小鼠用数据说清楚了:你练了多少次,并不是大脑真正在乎的事情。
万生优配提示:文章来自网络,不代表本站观点。