本篇文章2819字,读完约7分钟
作者:徐铁巡洋舰科技,本文改编自欧姆瑞·巴拉克教授的论文
机器学习的神经科学反对复杂系统机器学习和复杂系统正在改变工业和学术界在许多领域的传统方法,一个极好的例子是神经科学本身,它极大地启发了机器学习。在这里,我用一个生动的例子来说明这种方法是如何在这个领域发展起来的。
在文章的开头,我想问你一个问题。如果你为一只猫做一个模型,最好的方法是什么?这个问题太深奥了,你可以在读下面的时候找到答案。
神经科学是一个高度依赖数据的生物学分支。如果你想了解大脑是一个计算装置,你应该首先研究它的输入和输出,然后把它与动物的相应行为联系起来。
这个故事的第一部分是关于复杂系统的,因为神经系统本质上是一种复杂的网络。我们希望通过在计算机上建立一个类似大脑神经网络的复杂网络来理解神经细胞数据和行为之间的关系。这种努力在20世纪80年代和90年代非常流行。例如,霍普菲尔德网络口译记忆的最早现象等。
我们举一个典型的例子:
这里的科学家发现猴子可以被训练来比较两种不同频率的声音(错误应该受到惩罚)。这是一个测量短期记忆能力的典型实验。如果猴子需要比较两种声音,它们应该把第一种声音的信号放在脑袋里,然后和第二种声音进行比较。可以说,对生物来说,通过综合不同时期的信息来做出决策是非常重要的,而这个实验就是它的基础。
以前的神经科学研究方法可能只描述这种行为,然后在猴子的大脑中放置电极来测量相应的神经信号是什么。
例如,我们可以看到上图中测得的神经元放电信号,这个神经元放电的频率随着声音的频率而增加(红色代表高频声音),所以我们可以根据这个假设想象一个模型。下图中测量的细胞是相反的。你能根据这两张图片设计一个模型来解释猴子的行为吗?
真的没事!我们可以看到,最简单的物理模型可以解释这种现象。在左图中,我们用山谷中的球来描述这个模型(算法),这使得整个问题在非常低的维度上易于理解。整个外界输入(声音)可以看作是作用在猴子神经系统上的外力,而外力可以看作是某种驱动力,使猴子的神经元状态发生方向性的变化,就像球(猴子神经系统的状态)在外力塑造的谷中趋向底部(出现概率最高的状态,对应于物理学中最低的能量点),谷底的位置是第一个信号的记录(记忆)。当外力(f1)消失时,山谷的地形会改变,但外力不会立即改变。当第二个信号(f2)到来时,地形又变了。这个信号导致山谷膨胀,导致球滚到新的山谷底部(一个在左边,一个在右边)。这次球最终到达的位置不仅与这次的外力有关,而且与之前的外力(用于决策的综合历史信息)引起的位置高度相关,这实际上实现了两个信号(这里是最简单的图灵机)之间的比较,并被使用。那么如何使用我们刚才提到的两种神经元(与外部信号成正比或反比)来实现这个功能电路呢?请看右边的图片。我们甚至可以画一个电路图来解释这个原理。正号代表比例神经元,负号代表反向神经元,E代表随时间变化的控制信号,s2根据E改变电路连接,所以可以设计一个带记忆功能的减法器来实现。
然而,最后,这种方法是一种比较,许多真正的神经科学家称这种方法为玩具模型,但并不理会它。因为不管你电脑里的程序有多像大脑,它都离现实很远,而且有很多算法可以实现某种功能。为什么你说大脑根据你的想象工作?使用这种方法的计算神经科学家经常为他们的模型需要多少模拟而苦恼。正如有些人所说,如果你想为一只猫建立一个模型,最好是找到一只猫。
当然,拥有一个模型要比没有好得多。毕竟,它照亮了生物世界和数学世界之间的联系。它建立了一个我们可能理解的数学系统,这个数学系统建立在一个太复杂而不能触摸的生物系统上,并且允许我们通过改变参数空.来玩它
然而,模型开始发挥作用的真正时刻是机器学习的介入,传统的复杂系统方法也随之创新。为什么?
因为通过机器学习,我们有了一个强大而准确的方法来从数据中逆向模型,而不是以前的模糊类比。机器学习的理念与之前的理念的根本区别在于,我一开始并不热衷于设计与真实系统相同的模型,而是通过使用与真实模型原理大致相似的标准化模型来学习真实的输入和输出。这里的想法是,你不要追求画一只生动的猫,而是先做一些不同于猫的事情,让他学习和猫一样的行为。当这种行为是真实的和难以区分的,那么你认为它是猫。
一旦机器学习开始介入,模型就被赋予了可预测性,被赋予可预测性的模型在输入输出层面上可以被视为与真实系统无法区分,从而解决了模型复杂性不易设定、模型难以通过奥卡姆剃刀的缺陷。机器学习模型优于以前的模型,因为它有更多的交叉验证。当输入和输出已知时,用真实数据得到的模型不仅应该看起来像一只真实的猫,而且当输入未知时,也应该看起来像一只猫。也就是说,它真的需要有学习能力,像一只真正的猫,它不仅能在房子的角落里抓老鼠,还能在田野里抓老鼠。
通过这种方法,我们的研究框架发生了变化。我们需要找到一组特定的输入和输出作为研究的起点。例如,为了研究视觉区域,你找到一组猫和狗的照片,然后输出正确的分类。然后测试它。
与复杂系统模型方法不同,机器学习方法是一种黑箱操作思想。我们首先制作一个标准化的设备,然后向标准化的设备发送大量的输入,然后让标准化的系统改变参数以获得一组期望的输出。标准化黑盒的优点是训练参数的方法是已知的,因为这通常是一个极其困难的任务,这不同于传统的只追求定性描述的复杂系统模型的要求。
如果上述问题通过机器学习得到解决,它将变成:
这里的主角是一个标准化的神经网络。我们给出了各种条件下输入和输出之间的映射关系,然后在监督学习的框架下训练网络——即调整网络连接权值来模拟输入和输出的过程。这时,我们不需要设计,两种神经元(与实验成正比和成反比)就会自发地出现。也就是说,机器学习的猫拥有猫的所有功能,即使没有我们的过度描述(功能和形式之间的对应关系?).
我们现在有一只可以在各种场合抓老鼠的猫,但毕竟我们不需要一只机器猫。相反,我们需要通过机器猫来研究猫的行为,并知道猫是如何通过底层组件实现其功能的。毕竟,电子猫比真猫听话得多,我们可以随意解剖和改变参数。怎么做?再次回到复杂系统的动态分析;
这里新增的箭头是从高维神经网络到低维动态系统。还记得我们之前谈到的山坡球的玩具模型吗?它的机制是完美的,但不幸的是,人们并不信服。在这里,我们有机会再次伸张正义。我们取出经过训练的rnn,它与真实系统无法区分,然后用它进行“逆向工程”,取出一个低维系统,看看它的工作机制是否与我们的猜测一致。这里应该有掌声,因为这里我们用一种抽象的方法来回答一个几乎不可能用真实数据来验证的假设。
还有一种隐含的信念,认为受过训练的黑匣子已经学会了生物系统的本质。毕竟,你的rnn和现实是有区别的,但是在这里我们已经达到了我们目前所能做的极限。这里涉及到一个基本问题,即机器学习的核心是通过数据学习获得真实系统的数学表示,但仍然很难量化和解释这种表示与现实有多接近。