科学家发现大脑学习的新方法-健康知识-网者头条

摘要：神经科学家发现，大脑使用双重系统通过反复试验来学习。这是第一次确定第二个学习系统，这可以帮助解释习惯的形成，并为解决与习惯学习有关的条件（例如成瘾和强迫）提供了科学依据。对小鼠的研究也可能对帕金森氏症开发治疗剂有影响。...

UCL塞恩斯伯里惠康中心（SWC）的神经科学家发现，大脑使用双重系统通过反复试验来学习。这是第一次确定第二个学习系统，这可以帮助解释习惯的形成，并为解决与习惯学习有关的条件（例如成瘾和强迫）提供了科学依据。今天发表在自然，对小鼠的研究也可能对帕金森氏症开发治疗剂有影响。

科学家发现大脑学习的新方法

“本质上，我们找到了一种我们认为是负责习惯的机制。一旦您对某个行动产生了偏爱，您就可以绕过基于价值的系统，只依靠您过去所做的默认政策。这可能会让您可以释放认知资源来对其他事情做出基于价值的决策，” Marcus Stephenson-Jones-Jones-Jones-Jones-Jose of Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swic and Swip and Swic and Swip and Swip af swip and Swic and Swip tecress。

研究人员发现了大脑中的多巴胺信号，该信号是与先前已知的教学信号。大脑中的多巴胺信号已经被理解为形成奖励预测错误（RPE），在该奖励预测错误（RPE）中，无论实际结果比预期的更好还是更糟，它们都会向动物发出信号。在这项新研究中，科学家发现，与RPE并行，还有一个额外的多巴胺信号，称为动作预测误差（APE），该信号更新了执行操作的频率。这两个教学信号为动物提供了两种不同的学习方式，以做出选择，学习选择最有价值的选择或最常见的选择。

"Imagine going to your local sandwich shop. The first time you go, you might take your time choosing a sandwich and, depending on which you pick, you may or may not like it. But if you go back to the shop on many occasions, you no longer spend time wondering which sandwich to select and instead start picking one you like by default. We think it is the APE dopamine signal in the brain that is allowing you to store this default policy," explained Dr斯蒂芬森 - 琼斯。

与直接比较不同选项的价值相比，新发现的学习系统提供了一种存储信息的简单方法。这可能会使大脑释放多任务。例如，一旦您学会了开车，您也可以在旅途中与某人进行对话。当您的默认系统正在执行所有重复的任务以驱动汽车时，您的基于价值的系统可以决定要谈论什么。

先前的研究发现，学习所需的多巴胺神经元位于中脑的三个区域：腹侧段落区域，底底尼格拉（Nigra nigra pars compacta）和黑质Nigra pars holderalis。尽管一些研究表明这些神经元参与编码奖励，但较早的研究发现，这些神经元的一半是运动代码，但原因仍然是一个谜。

RPE神经元向纹状体的所有区域进行了项目，除了纹状体的尾巴。而运动特异性神经元向除伏核核外的所有区域发射。这意味着伏隔核仅信号奖励奖励，纹状体的尾部仅信号运动。

通过研究纹状体的尾巴，团队能够隔离运动神经元并发现其功能。为了测试这一点，研究人员使用了小鼠的听觉歧视任务，该任务最初是由冷泉港实验室的科学家开发的。 CO第一作者Francesca Greenstreet博士，Hernando Martinez Vergara博士和Yvonne Johansson博士使用了遗传编码的多巴胺传感器，该传感器表明该地区的多巴胺释放与奖励无关，但与运动有关。

“当我们使纹状体的尾巴生气时，我们发现了一种非常特征的模式。我们观察到，病变的小鼠和对照小鼠最初以相同的方式学习，但是一旦它们达到约60-70％的表现，他们的表现约为60-70％，即当他们发展出一种偏好时，例如，当高音调左右，只要保持较低的音调，就可以继续进行素质，然后才能开发一种素质的素质，而一位素质的成绩是一定的。时尚。这是因为病变的小鼠只能使用RPE，而控制小鼠有两个学习系统RPE和APE，这有助于选择。” Stephenson Jones博士解释说。

为了进一步理解这一点，团队在专家小鼠中沉默了纹状体的尾巴，发现这对他们在任务中的表现产生了灾难性的影响。这表明，尽管在早期学习动物中，使用基于RPE的基于价值的系统形成了偏好，但在较晚学习中，他们切换到在纹状体的尾部独家使用猿来存储这些稳定的关联并推动他们的选择。该团队还使用Claudia Clopath博士领导的广泛的计算建模来了解两个系统RPE和APE如何一起学习。

这些发现暗示了为什么很难破坏不良习惯，以及为什么用其他事情取代动作可能是最好的策略。如果您始终如一地更换一项动作，例如咀嚼尼古丁口香糖而不是吸烟，猿类系统可能能够接管并在另一个习惯上形成新的习惯。

“既然我们知道了大脑中的第二个学习系统，我们将有一个科学的基础来制定新的策略来违反不良习惯。到目前为止，关于成瘾和强迫症的大多数研究都集中在Accumbens的核心上。我们的研究为潜在的治疗靶标开设了一个新的地方，以实现潜在的治疗目标，”

这项研究还对帕金森氏症具有潜在的影响，帕金森氏症是由中脑多巴胺神经元死亡的，特别是在黑质尼格拉pars compacta引起的。已证明死亡的细胞的类型是与运动相关的多巴胺神经元，可能负责编码猿。这可以解释为什么患有帕金森氏症的人在做习惯行为（例如步行）时会经历不足，但是他们不会在诸如滑冰之类的更灵活的行为中遇到缺陷。

“突然，我们现在有了帕金森氏症中矛盾运动的理论。与运动相关的神经元是推动习惯行为的神经元。因此，使用习惯系统的运动受到了损害，但是使用基于价值的灵活系统的运动很好。这使我们可以在大脑中进行新的位置，并为pardinson od parkinson of pardudsed of stephenson-jys of stephenson-jys''

研究小组现在正在测试是否确实需要习惯。他们还在探索每个系统中确切学到的东西以及两者如何一起工作。 This research was funded by an EMBO Long-Term Fellowship (ALTF 827-2018), a Swedish Research Council International Postdoc Grant (2020-06365), the Sainsbury Wellcome Centre Core Grant from the Gatsby Charitable Foundation and Wellcome (219627/Z/19/Z), the Sainsbury Wellcome Centre PhD Programme, and a European Research Council grant (Starting #557533).

本文地址：https://www.nser.net/jiankang/44595040446313.html

相关推荐