今年,AI 技术的爆发式发展和脑机接口的新实验进展,让不少人对科幻走入现实有了新的期待:
我们是否能像《黑客帝国》里那样,通过刺激大脑就让自己置身于各种奇幻的虚拟世界?
我们能否通过脑机接口破译残障病人大脑中的电信号而帮他们重新走路或说话?
我们是否能让机器像人类一样“认识”和“感受”世界?
这些命题的核心,其实是一个困扰了脑科学领域几十年的问题:大脑是如何编码外界信息的?
试想,你现在正盯着屏幕阅读这篇文章,而此时你的大脑中正呈现着各种各样的信息:眼前的屏幕、屏幕上的文字、房间中灯光的亮暗、远处的声音、你读文章产生的思考、你此时的心情……
我们无时无刻不生活在一个充满各种信息的世界中,而大脑的一个关键任务就是将这些信息一一编码并呈现在脑海中,这样我们才能利用这些信息产生记忆、进行思考、并做出行动。
计算机将二进制的 “0” 和 “1” 作为其编码的基本单位,而大脑是由成千上万的神经元组成的,那么神经元又是如何编码抽象的信息的呢?这就是我们今天要讨论的问题。
01、神经元如何被激活?
动作电位是神经元激活并沟通的基本方式。研究大脑如何将信息转化为神经元的电信号,这就是“编码”的问题;研究如何通过神经元的活动反推大脑的所见所想,这就是“解码”。
如果我们有一天了解了大脑的编码和解码,就好比成为了出色的“大脑程序员”,能够使用这些代码,破译代码,甚至改写代码——这已经无限接近于文章开头的科幻故事了。
所以,研究大脑中的神经编码是当今脑科学界毋庸置疑的核心问题之一。在神经科学五大分支之一中,整个系统神经科学领域基本都是在研究该问题。
那么,回到上文“你此时正在对着屏幕读这篇文章”的例子中,现如今,我们对大脑如何编码视觉、环境等信息已经有了哪些具体了解呢?
当今风口浪尖上的脑机接口又是如何对脑电信号实现破译解码的呢?
下面,我们来简要回顾脑科学对神经编码这一问题探究的 3 个阶段:
02、第一阶段 “超级细胞”
上世纪 60 年代,哈佛大学的大卫·休伯尔(David Hubel)和托斯坦·维厄瑟尔(Torsten Wiesel)开启了用精密电极记录大脑中单个细胞活动的先河,并因揭示视觉皮层中单个神经元如何编码视觉刺激获得了诺贝尔生理学与医学奖。
大卫·休伯尔(左)和托斯坦·维厄瑟尔(右),图片来源:braintour.harvard.edu
彼时,一个重要的想法也随之诞生了:各种各样的信息或许是由大脑中的一个个“超级细胞”编码的,例如有的神经元编码“花”,有的神经元编码“草”,有的编码“红烧肉”,甚至有的编码“我的祖母”等抽象内容。
2005 年一篇《自然》(Nature)上轰动一时的文章支持了这一想法,他们发现人类受试的大脑中有专门编码《老友记》中演员詹妮弗·安妮斯顿的细胞:这个细胞对其他人和物体都没反应,但是一看安妮斯顿的照片就会被激活。
只在看到詹妮弗·安妮斯顿时才激活的细胞。图片来源:《Invariant visual representation by single neurons in the human brain》
类似的,该文章还找到了“悉尼歌剧院细胞”:该细胞只在看到悉尼歌剧院的照片时才激活,对其他场景或人物都不感兴趣。
只在看到悉尼歌剧院时才激活的细胞。图片来源:《Invariant visual representation by single neurons in the human brain》
在“超级细胞”的理论中,每个细胞各司其职;就好比在一个班集体中,有专门的学习委员负责学习、体育委员负责运动会、劳动委员负责值日,大家各有分工。
这样的细胞在大脑中还有很多,譬如海马体中的“位置细胞”:当我们在一个房间中行走时,海马体中的单个细胞会对应编码二维空间中的一个位置,每当我们走到房间中某特定位置时,与其对应的细胞会被激活。
位置细胞的发现也获得了 2014 年的诺贝尔奖——在“超级细胞”理论的黄金年代,似乎大家相信只要拿着电极去大脑里“淘金”,总能找到一些神奇的“超级细胞”。
但是,“超级细胞”的理论存在一个致命问题:大脑中的细胞一共就那么多,如果真是每一个细胞编码一种信息,细胞用完了怎么办?
要知道我们一生都在不断学习新的信息。“超级细胞”确实不是一种高效的编码方法,于是,“混合编码”的想法也随之诞生。
03、第二阶段 混合编码
混合编码的想法也很自然:班里的学习委员、体育委员和劳动委员不应该只负责自己的那摊事。例如大扫除来了,体育委员可以帮着劳动委员承担一部分工作;通知要春游时,可以临时由学习委员和文艺委员共同组织。
换言之,每个人虽然有主要负责的内容,但这种特异性分工并不绝对,可根据任务情况混合处理,体现出一种“混合特异性”。
在斯坦福大学 2013 年的一项研究中,研究人员发现猴子前额叶的神经元对刺激信号的颜色、运动、环境等多个实验因素体现出混合特异性,其激活程度取决于这些因素的排列组合:例如有的细胞对红色、向左的刺激最敏感,有的细胞则对蓝色、向右的刺激最敏感。
混合特异性很好地解决了“超级细胞”理论中一对一编码信息低效的问题:细胞是“一专多能”的,同一细胞能同时编码多种信息,每种信息也散布在多个细胞之中。
混合编码的想法在近些年得到了越来越多的关注。已经有计算机建模研究表明,混合编码的方式相比超级细胞编码更高效,其能编码的信息也更复杂。
04、第三阶段 群体编码
上文中我们关注了像安妮斯顿细胞、位置细胞、甚至混合特异性细胞等有较明确编码信息的细胞。
但其实这类细胞只占大脑全部细胞的一小部分——还有大量的细胞也在放电,但我们却很难清晰界定他们具体在编码什么。即便如此,这些细胞身上是否也携带着信息呢?
基于这个疑问,科学家提出了“群体编码”的想法:与其关注个别的编码细胞,或许我们可以用机器学习等数据分析方法将神经元群体作为一个整体来考虑,以求从更多的神经元中读取出多更多的信息。
这也不难理解,100 个神经元储存的信息总是可以比 10 个神经元储存的信息更多。
如果对应之前举的班干部的例子的话,与其把班里的工作全都交给班干部,何不由全班同学共同合作完成呢?所以我们可以将整个班级看作一个整体,研究这个班集体是如何开展大扫除,如何组织春游,以及在运动会上团体表现如何的。
目前最前沿的脑机接口正是基于群体编码的想法来实现的:科研人员记录受试脑内全部神经元的电信号,然后用这些电信号来训练一个机器学习的解码器,这个解码器会实时读取神经元群体的电信号,并以此来预测受试想要移动的方向并操作机械手。
这一革新技术正在开始给一些残障病人的生活带来新的希望。
利用脑机接口帮助残障病人实现实时书写。图片来源:《High-performance brain-to-text communication via handwriting》
例如,2021 年斯坦福大学 Shenoy 组就利用群体神经元的电信号训练循环神经网络,帮助脊椎瘫痪病人以接近 95% 的准确率完成书写。
近十几年来,随着活体光学成像技术的发展,我们已经能够同时记录成百甚至上千个神经元的群体活动。
随着这一技术进步,人们又开始思考一种理解群体编码的新思路:将每个神经元的电活性作为一个维度,那么每个时刻 N 个神经元的激活就对应了 N 维空间的一个点——我们的感知、思考和意识过程也就对应了这个 N 维空间中的一条线,这条线就叫做神经轨迹。
你可以这样想象:
有这样一个抽象的 N 维空间对应了我们所有可能的思想活动,而我们的思想就像这个 N 维空间中一条游来游去的小鱼。
这条小鱼会响应外部的刺激,也被我们自己的思考和情绪所驱使。它无时无刻都在我们的脑海世界中畅游。
这是理解大脑编码的一种全新思路,研究神经轨迹能进一步理解神经元群体的活动,也能预测了我们的行为。
在 2012 年的《自然》杂志一篇文章中,对群体神经元的光学成像技术让研究人员不仅能记录小鼠脑内实时的神经轨迹,还可以预测小鼠在几秒后会向左转还是向右转的决策——小鼠已经通过神经轨迹在脑海中做好了决定,神经轨迹的方向就决定了小鼠要行动的方向。
05、总结:向未来提问
大脑曾经像一个黑箱,神秘而不可知。
如今,我们开始走进这个黑箱,试图理解大脑的密码,这是非常令人激动的。最后,作为日常研究神经编码的科研人员,谈谈我个人对这个问题未来的展望。
我们离开篇提到的脑机接口等科幻场景到底有多远?很远。
一个科研中常见的现象时,即便我们收集到了成百上千神经元的激活“代码”,这份代码依旧像一本无字天书,基本搞不懂它在说什么。
这就好比编程的初学者,面对着满眼的“for loop”和“end”全然摸不着头脑。
例如,我自己在做数据分析时,面对着成百上千神经元几个 TB 的数据,经常第一步要做的就是把所有能想到的数据分析方法诸如 ANOVA、PCA、SVM 等通通都先盲试一遍,然后看看有没有什么发现。
这个现象背后的原因就是,我们对大脑的编码还缺乏一些根本性、原理性的认识,于是只能从表层的数据中做文章。
一个脑科学乃至整个生物学界被大家诟病许久的问题是,我们对生物系统缺乏像“牛顿三定律”一样的根本规律性的认识。
这一问题依旧存在,也似乎还会存在不短的时间,但它却是我们想要更深入了解大脑绕不过去的。
当然,我们还是可以期待新技术的发展能不断为这一领域持续输入新鲜血液。
从单细胞电极记录到光学成像,我们能同时记录的神经元由 10 个变成了 100 个,现在又变成了 1000 个,不断成指数增长。
最新的光学成像技术更是能让我们同时记录多个脑区、甚至小鼠整个大脑皮层的神经元——神经元数量已经距离突破 10000 这个数量级非常接近了。
这要多亏了许多物理学、光学、机械工程背景的科学家近些年来涌入神经科学领域,使得这些先进的电记录和光学成像技术成为可能。
所以在最后,我更乐意去幻想,或许在几十年后《黑客帝国》中的桥段不再是天方夜谭。
参考文献:
[1] Quiroga, R. Q., Reddy, L., Kreiman, G., Koch, C., & Fried, I. (2005). Invariant visual representation by single neurons in the human brain. Nature, 435(7045), 1102-1107.
[2] Mante, V., Sussillo, D., Shenoy, K. V., & Newsome, W. T. (2013). Context-dependent computation by recurrent dynamics in prefrontal cortex. nature, 503(7474), 78-84.
[3] Willett, F. R., Avansino, D. T., Hochberg, L. R., Henderson, J. M., & Shenoy, K. V. (2021). High-performance brain-to-text communication via handwriting. Nature, 593(7858), 249-254.
[4] Kim, T. H., & Schnitzer, M. J. (2022). Fluorescence imaging of large-scale neural ensemble dynamics. Cell, 185(1), 9-41;
[5] Harvey, C. D., Coen, P., & Tank, D. W. (2012). Choice-specific sequences in parietal cortex during a virtual-navigation decision task. Nature, 484(7392), 62-68.
[6]https://braintour.harvard.edu/archives/portfolio-items/hubel-and-wiesel