您当前浏览器版本过低，为了不影响您的使用，建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器，更换浏览器后使用更流畅！（注意！双核浏览器请切换为极速模式）

工信部人工智能赋能中小企业典型应用场景案例（科研领域）

大模型长脑子了？研究发现LLM中层会自发模拟人脑进化

2026-01-22

4980

艾思科蓝官网-版头.gif

转自机器之心

生物智能与人工智能的演化路径截然不同，但它们是否遵循某些共同的计算原理？

最近，来自帝国理工学院、华为诺亚方舟实验室等机构的研究人员发表了一篇新论文。该研究指出，大型语言模型（LLM）在学习过程中会自发演化出一种协同核心（Synergistic Core）结构，有些类似于生物的大脑。

640 (12).png

论文标题：A Brain-like Synergistic Core in LLMs Drives Behaviour and Learning
论文地址：https://arxiv.org/abs/2601.06851

640 (13).png

研究团队利用部分信息分解（Partial Information Decomposition, PID）框架，对 Gemma、Llama、Qwen 和 DeepSeek 等模型进行了深度剖析。

他们发现，这些模型的中层表现出极强的协同处理能力，而底层和顶层则更偏向于冗余处理。

协同与冗余：LLM 的内部架构

研究团队将大型语言模型视为分布式信息处理系统，其核心实验设计旨在量化模型内部组件之间交互的本质。为了实现这一目标，研究者选取了 Gemma 3、Llama 3、Qwen 3 8B 以及 DeepSeek V2 Lite Chat 等多种具有代表性的模型系列进行对比分析。

实验方法与量化指标

在实验过程中，研究者向模型输入了涵盖语法纠错、逻辑推理、常识问答等 6 个类别的认知任务提示词。

针对每一个提示词，模型会生成一段 100 个 Token 的回答，实验设备则同步记录下每一层中所有注意力头或专家模块的激活值。

具体而言，研究人员计算了这些输出向量的 L2 范数，以此作为该单元在特定时间步的激活强度数据。

基于这些时间序列数据，研究团队应用了整合信息分解（Integrated Information Decomposition, ID）框架。

这一框架能够将注意力头对之间的交互分解为「持续性协同」和「持续性冗余」等不同原子项。

通过对所有注意力头对的协同值和冗余值进行排名并求差，研究者得到了一个关键指标：协同-冗余秩（Synergy-Redundancy Rank）。该指标能够清晰地标示出模型组件在处理信息时，究竟是倾向于进行独立的信号聚合，还是在进行跨单元的深度集成。

跨模型的空间分布规律

实验数据揭示了一个在不同架构模型中高度一致的空间组织规律。在归一化后的模型层深图中，协同分布呈现出显著的「倒 U 型」曲线：

640 (14).png

冗余外周（Redundant Periphery）：模型的早期层（靠近输入端）和末期层（靠近输出端）表现出极低的协同秩，信息处理以冗余模式为主。在早期层，这反映了模型在进行基本的解词元化（Detokenization）和局部特征提取；而在末期层，则对应着 Token 预测和输出格式化的过程。
协同核心（Synergistic Core）：模型的中层则展现出极高的协同秩，形成了核心处理区。例如，在对 Gemma 3 4B 的热图分析中，中间层的注意力头之间表现出密集且强烈的协同交互，这正是模型进行高级语义集成和抽象推理的区域。

架构差异与一致性

值得注意的是，这种「协同核心」的涌现并不依赖于特定的技术实现。

在 DeepSeek V2 Lite 模型中，研究者即使是以「专家模块」而非「注意力头」作为分析单位，依然观察到了相同的空间分布特征。

这种跨架构的收敛性表明，协同处理可能是实现高级智能的一种计算必然，而非单纯的工程巧合。

这种组织模式与人脑的生理结构形成了精确的映射：人脑的感官和运动区域同样表现出高冗余性，而负责复杂认知功能的联合皮层则处于高协同的「全局工作空间」中心。

智能的涌现：学习驱动而非架构使然

一个关键的问题在于：这种结构是 Transformer 架构自带的，还是通过学习习得的？

研究人员通过分析 Pythia 1B 模型的训练过程发现，在随机初始化的网络中，这种「倒 U 型」的协同分布并不存在。随着训练步数的增加，这种组织架构才逐渐稳定形成。

640 (15).png

这意味着，协同核心是大模型获得能力的标志性产物。

在拓扑性质上，协同核心具有极高的「全局效率」，有利于信息的快速集成；而冗余外周则表现出更强的「模块化」，适用于专门化处理。这种特征再次与人类大脑的网络架构形成了精确的平行关系。

协同核心的功能验证

为了验证协同核心是否真的驱动了模型行为，研究团队进行了两类干预实验：消融实验和微调实验。

消融实验：研究发现，消融那些高协同性的节点，会导致模型出现灾难性的性能下降和行为背离，其影响远超随机消融或消融冗余节点。这证明协同核心是模型智能的核心驱动力。

640 (16).png

微调实验：在强化学习微调（RL FT）场景下，仅针对协同核心进行训练，获得的性能提升显著优于针对冗余核心或随机子集的训练。有趣的是，在监督微调（SFT）中这种差异并不明显。研究者认为，这反映了 RL 促进通用化而 SFT 更多倾向于记忆的特性。

640 (17).png

结语

这项研究为大模型的可解释性开辟了新路径。它表明，我们可以从「自上而下」的信息论视角来理解模型，而不仅仅是「自下而上」地寻找特定的电路。

对于 AI 领域，识别协同核心有助于设计更高效的压缩算法，或者通过更有针对性的参数更新来加速训练。对于神经科学，这提供了一种计算上的验证，预示着协同回路在强化学习和知识迁移中可能扮演着至关重要的角色。

大模型虽然基于硅基芯片和反向传播算法，但在追求智能的过程中，它们似乎不约而同地走向了与生物大脑相似的组织模式。这种智能演化的趋同性，或许正是我们揭开通用智能奥秘的关键线索。

更多详情请参阅原论文。

艾思科蓝官网-版尾.jpg

已收藏 0

点赞 5

上一篇：Nature Cities最新研究！揭示反射性材料在非正式定居点热应激缓解中的跨学科应用潜力！下一篇：安三奇团队揭示禁食通过细菌介导甲硫氨酸代谢-m6A抑制特异性的肿瘤人群

学术会议

【诺奖得主领衔 | 高届数稳定EI检索】第十届能源、环境与材料科学国际学术会议(EEMS 2026）

【诺奖得主领衔 | 高届数稳定EI检索】第十届能源、环境与材料科学国际学术会议(EEMS 2026）

第十届能源、环境与材料科学国际学术会议(EEMS 2026）将于2026年7月10-12日在广东广州召开。会议将围绕“能源、环境与材料科学”的最新研究领域展开探讨

2026-07-10

【末轮截稿|连续5届稳定EI检索】第六届新材料与化学工程国际学术会议（AMCE 2026)

【末轮截稿|连续5届稳定EI检索】第六届新材料与化学工程国际学术会议（AMCE 2026)

第六届新材料与化学工程国际学术会议（AMCE 2026）将于2026年7月17-19日在中国广州召开。会议将对行业科技发展目标和任务进行全面深入的探讨，总结国内外近期开发的先进材料研究和关键技术。

2026-07-17

【IEEE出版|往届2.5个月检索|中山大学主办】第六届计算机科学与区块链国际学术会议（CCSB 2026）

【IEEE出版|往届2.5个月检索|中山大学主办】第六届计算机科学与区块链国际学术会议（CCSB 2026）

第六届计算机科学与区块链国际学术会议（CCSB 2026）定于2026年8月21-23日在珠海市召开。会议旨在为计算机科学与区块链相关领域的专家学者提供一个交流学术成果、促进合作交流的广泛平台。

2026-08-21

【IEEE出版|英国布鲁内尔大学主办】第七届计算机视觉与数据挖掘国际学术会议（ICCVDM 2026）

【IEEE出版|英国布鲁内尔大学主办】第七届计算机视觉与数据挖掘国际学术会议（ICCVDM 2026）

第七届计算机视觉与数据挖掘国际学术会议（ICCVDM 2026）定于2026年8月15-17日在英国伦敦召开。会议旨在为计算机视觉、数据挖掘等计算机领域的专家学者提供一个可交流学术成果、促进合作的平台

2026-08-15

【IEEE出版 | 往届均已检索】第五届航空航天工程与系统国际研讨会（ISAES 2026）

【IEEE出版 | 往届均已检索】第五届航空航天工程与系统国际研讨会（ISAES 2026）

由贵州理工学院主办的第五届航空航天工程与系统国际研讨会（ISAES 2026）于2026年7月24-26日在贵州贵阳市召开。涵盖多个领域的议题，航空器设计、航天器系统、航空动力推进、飞行控制技术等；

2026-07-24

IEEE出版｜第五届人工智能、物联网和云计算技术国际会议（AIoTC 2026）

IEEE出版｜第五届人工智能、物联网和云计算技术国际会议（AIoTC 2026）

AIoTC 2025已见刊检索。AIoTC 2026主要围绕“人工智能、物联网和云计算技术”的最新研究展开，旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员，分享研究成果

2026-07-17

相关资讯

重磅！中科大、清华大学创造纪录！

记者从中国科学技术大学获悉，该校潘建伟、张强等与清华大学王向斌、济南量子技术研究院刘洋、中国科学院上海微系统与信息技术研究所尤立星、张伟君等合作，通过发展低串扰相位参考信号控制、极低噪声单光子探测器等技术，实现了光纤中1002公里点对点远距离量子密钥分发，不仅创下了光纤无中继量子密钥分发距离的世界纪录，也提供了城际量子通信高速率主干链路的方案。

50747

20

2023-05-31

985高校，突破半世纪极限！

据西北工业大学官微消息，日前，西北工业大学空天微纳系统创新团队在飞行器减阻方面取得突破性进展。该团队通过模仿我国库姆塔格沙漠特有的舌状分形沙垄结构，设计出仿沙垄舌形多层分形减阻微纳结构。该结构减阻率较之前国际报道的最好水平提高了52%，减阻风向摄动角度从35°增加到了60°，减阻性能已突破半世纪以来小肋气动减阻技术性能极限。

49937

25

2023-04-04

IF=78.5：全球首个乙肝功能性治愈药物诞生！乙肝治疗进入“治愈时代”

IF=78.5：全球首个乙肝功能性治愈药物诞生！乙肝治疗进入“治愈时代”

4537

3

2026-06-09

“渐冻症”或迎来治疗新希望！《科学》：“逆转”毒性蛋白损伤，这种分子能做到

“渐冻症”或迎来治疗新希望！《科学》：“逆转”毒性蛋白损伤，这种分子能做到

4641

3

2026-06-05

最新 Science 封面，没给任何一篇论文，给了大鱼

最新 Science 封面，没给任何一篇论文，给了大鱼

4733

3

2026-05-16

西安建大云斯宁教授Chemical Engineering Journal：驱动高熵氧化物/萤石异质结构电解质中的超离子传输，助力提升燃料电池性能

西安建大云斯宁教授Chemical Engineering Journal：驱动高熵氧化物/萤石异质结构电解质中的超离子传输，助力提升燃料电池性能

4712

4

2026-05-08

最新文章

IF=78.5：全球首个乙肝功能性治愈药物诞生！乙肝治疗进入“治愈时代”

“渐冻症”或迎来治疗新希望！《科学》：“逆转”毒性蛋白损伤，这种分子能做到

最新 Science 封面，没给任何一篇论文，给了大鱼

西安建大云斯宁教授Chemical Engineering Journal：驱动高熵氧化物/萤石异质结构电解质中的超离子传输，助力提升燃料电池性能

211大学，首位“无毕业论文”的博士毕业了

上海大学「国家杰青」李辉/陈超Nature Water丨可回收淀粉样蛋白磁性纳米网主动捕获去除水中纳米塑料！

校史首篇！985副教授，发顶刊

校史首篇！东南大学副教授，发顶刊

热门标签

#计算机期刊

#EI会议论文

我们的服务

会议解决方案

SCI全程无忧

全球智库平台

期刊智能匹配

关于我们: 平台介绍; 联系我们; 学术诚信; ISO认证

帮助中心: 常见问题; 客服中心; 服务热线：400-607-9388; 服务邮箱：customer_services@ais.cn

艾思科蓝公众号

艾思科蓝小程序

Copyright © 2019 - 2026 广州科奥信息技术股份有限公司 All Rights Reserved

增值电信业务许可证：合字B2-20250773 粤ICP备16087321号

粤公网安备 44010402002119

立即开启