发布时间:2025-03-03 浏览次数:11

2025123日,复旦大学智能复杂体系基础理论与关键技术实验室于玉国教授团队“视觉脉冲神经网络”方向的论文被国际人工智能顶会ICLR(The Thirteenth International Conference on Learning Representations)spotlight形式录用(top 3.2% scoring paper)(1)。论文第一作者为博士后钟海鑫,通讯作者是于玉国教授,合作研究人员包括浙江大学Anna Wang Roe教授,华东理工大学王如彬教授,复旦大学戴维青年副研究员,和王浩宇、黄明逸、黄予超等博士生。该研究提出了基于突触可塑性自演化脉冲神经网络模型(self-evolving spiking neural network, SESNN),揭示了高等哺乳动物初级视觉皮层(V1)中风车状(pinwheel)朝向功能柱结构的可塑性网络机制,并证明其相较于低等哺乳动物的“盐胡椒”(salt-and-pepper)结构在布线成本、编码效率和对图像噪声鲁棒性等方面具有显著的计算优势。


1 “视觉脉冲神经网络”方向的论文首页


哺乳动物视皮层V1区的神经元对视觉刺激的朝向具有选择性,这些神经元群的空间排列模式在不同物种间呈现出了有显著差异的拓扑特征。低等哺乳动物(如大、小鼠)的神经元群呈现无序的“盐胡椒”分布,而高等哺乳动物(如猫、猕猴)则形成空间有序的“风车”拓扑结构。尽管此类结构差异早被观察到,但其形成的脉冲神经机制及其功能意义长期悬而未决。以往的研究利用简单的自组织特征映射网络 (self-organizing feature map) 引入“赢者通吃”和“相邻相似”的原则,探讨了视皮层风车状结构的形成机制。然而,这些研究主要关注原则性的拓扑组织,却缺乏对真实脉冲神经网络在突触可塑性规则调控下,如何在自然图像学习过程中自发形成“盐胡椒状”或“风车状”拓扑结构的系统研究和机制解释。尤其是形成的不同类型的拓扑结构和视觉信息表征的关系也罕有系统性的研究。为此,于玉国教授团队基于多个物种“视网膜-V1”解剖学实验数据,包括视网膜拓扑、神经元形态和跨物种连接模式投射等,构建了一种二维自组织演化的脉冲神经网络SESNN模型(图2d,通过类Hebbian可塑性规则,调控神经元之间的突触连接来实现对自然图像的学习过程(图2a。研究首次在脉冲神经网络中成功复现了风车结构的动态形成过程(图2e。该计算模型突破了大多传统基于抽象数学或静态连接模型难以动态模拟生物真实网络功能图演化过程的局限性。


2 提出的可塑性脉冲神经网络SESNN,在自然图像的刺激和类Hebbian可塑性规则之下,神经网络可以自发形成视皮层风车状拓扑结构。a. 160张像素为512x512的自然图片集。b. 从自然图片中随机裁剪出100张大小为(16-ε)n^(1/2)+ ε正方形图片块作为模型的输入刺激 为视觉输入的重叠度,单位为pixels;n为神经元数量)。c. 兴奋与抑制神经元群体。d. SESNN主要框架,右下角插图:神经元满足周期性边界条件。e. SESNN重构了视觉风车拓扑结构。


研究表明,皮层相邻神经元对应的视觉图像输入的重叠度(visual field overlap)是决定神经元群形成有序化拓扑功能图的关键因素:当相邻神经元的视野重叠度超过一定的阈值时,意味着相邻神经元接收的输入刺激相关性超过一定阈值,通过兴奋-兴奋局部突触可塑性驱动神经元形成等朝向区域(iso-orientation domains)并维持拓扑结构的连续性,但兴奋-抑制-兴奋局部环路因产生侧抑制而使得兴奋-兴奋神经元表征角度不同,进而实现拓扑结构的朝向覆盖性,最终通过竞争与协作生成风车中心;反之,较少的视野重叠度,则无法维持拓扑结构的连续性而则导致散乱的随机分布(图3a。这一发现首次将解剖学参数(如神经元密度、视网膜映射比例)与功能性拓扑结构直接关联,揭示了物种间视觉系统差异的演化逻辑。此外,风车结构通过平衡局部同向连接与抑制竞争,降低了网络布线成本(图3b,并提升了朝向功能图网络对图像输入的群体编码的高度稀疏性(图3c和高能效的编码成本-效率(图3b。该拓扑结构在自然图像噪声环境下的响应可靠性与盐胡椒模式相比,展现出更强的鲁棒性(图3d-e。最后,模型还进一步揭示了神经元密度与轴突连接范围对超柱尺寸的调控作用,并通过解剖学数据验证了“视网膜-V1映射比”可作为跨物种拓扑分类的线性判据(图4ab


3 a. 视觉输入的重叠度决定皮层神经元空间排布的差异性。b. 风车结构在演化过程中,降低了布线成本,提升了“成本-编码效率”。c. 提高了群体编码的稀疏性。d-e. 在输入刺激混入高斯白噪声时,比盐胡椒结构具有更强的鲁棒性。


4 基于感受野密度的线性分类器()可有效区分具有“盐胡椒”结构(如大鼠、小鼠、灰松鼠)与“风车”结构(如猕猴、雪貂、猫、树鼩)的物种。a. 该分类器反映了不同物种V1组织模式的差异。b. 以“V1神经元数量与视网膜面积之比”为分类依据的散点图表明,该比例为风车结构形成的关键阈值,高于该值的物种倾向于形成有序拓扑。


这一研究成果不仅阐明了视觉皮层功能图形成的可塑性突触机制,还首次在脉冲神经网络中建立了“结构-功能”的定量关联,为理解高效视觉编码的进化优势提供了基本理论框架。其揭示的“信息-成本效率”优化原则,在低功耗、高能效的视觉类脑计算模型算法的设计具有重要的启发价值。


感谢科技创新2030——“脑科学与类脑研究”重大项目(2021ZD0201301)以及国家自然科学基金(U20A20221、12201125、12072113)的支持。同时,感谢上海市科学技术委员会“上海优秀学术带头人计划”(21XD1400400)、“扬帆计划”(22YF1403300)以及中国博士后科学基金(2023M740724)的资助。


ICLR是机器学习和人工智能领域的四大顶级学术会议之一(h5 index = 304,在人工智能顶会h5排名中位居第二),全称为国际学习表征会议(International Conference on Learning Representations)ICLR每年举办一次,今年共收到11,672篇有效投稿,oralspotlight录用率为5.1%。会议将于2025424-28日在新加坡举行。




发布时间:2025-03-03 浏览次数:11

2025123日,复旦大学智能复杂体系基础理论与关键技术实验室于玉国教授团队“视觉脉冲神经网络”方向的论文被国际人工智能顶会ICLR(The Thirteenth International Conference on Learning Representations)spotlight形式录用(top 3.2% scoring paper)(1)。论文第一作者为博士后钟海鑫,通讯作者是于玉国教授,合作研究人员包括浙江大学Anna Wang Roe教授,华东理工大学王如彬教授,复旦大学戴维青年副研究员,和王浩宇、黄明逸、黄予超等博士生。该研究提出了基于突触可塑性自演化脉冲神经网络模型(self-evolving spiking neural network, SESNN),揭示了高等哺乳动物初级视觉皮层(V1)中风车状(pinwheel)朝向功能柱结构的可塑性网络机制,并证明其相较于低等哺乳动物的“盐胡椒”(salt-and-pepper)结构在布线成本、编码效率和对图像噪声鲁棒性等方面具有显著的计算优势。


1 “视觉脉冲神经网络”方向的论文首页


哺乳动物视皮层V1区的神经元对视觉刺激的朝向具有选择性,这些神经元群的空间排列模式在不同物种间呈现出了有显著差异的拓扑特征。低等哺乳动物(如大、小鼠)的神经元群呈现无序的“盐胡椒”分布,而高等哺乳动物(如猫、猕猴)则形成空间有序的“风车”拓扑结构。尽管此类结构差异早被观察到,但其形成的脉冲神经机制及其功能意义长期悬而未决。以往的研究利用简单的自组织特征映射网络 (self-organizing feature map) 引入“赢者通吃”和“相邻相似”的原则,探讨了视皮层风车状结构的形成机制。然而,这些研究主要关注原则性的拓扑组织,却缺乏对真实脉冲神经网络在突触可塑性规则调控下,如何在自然图像学习过程中自发形成“盐胡椒状”或“风车状”拓扑结构的系统研究和机制解释。尤其是形成的不同类型的拓扑结构和视觉信息表征的关系也罕有系统性的研究。为此,于玉国教授团队基于多个物种“视网膜-V1”解剖学实验数据,包括视网膜拓扑、神经元形态和跨物种连接模式投射等,构建了一种二维自组织演化的脉冲神经网络SESNN模型(图2d,通过类Hebbian可塑性规则,调控神经元之间的突触连接来实现对自然图像的学习过程(图2a。研究首次在脉冲神经网络中成功复现了风车结构的动态形成过程(图2e。该计算模型突破了大多传统基于抽象数学或静态连接模型难以动态模拟生物真实网络功能图演化过程的局限性。


2 提出的可塑性脉冲神经网络SESNN,在自然图像的刺激和类Hebbian可塑性规则之下,神经网络可以自发形成视皮层风车状拓扑结构。a. 160张像素为512x512的自然图片集。b. 从自然图片中随机裁剪出100张大小为(16-ε)n^(1/2)+ ε正方形图片块作为模型的输入刺激 为视觉输入的重叠度,单位为pixels;n为神经元数量)。c. 兴奋与抑制神经元群体。d. SESNN主要框架,右下角插图:神经元满足周期性边界条件。e. SESNN重构了视觉风车拓扑结构。


研究表明,皮层相邻神经元对应的视觉图像输入的重叠度(visual field overlap)是决定神经元群形成有序化拓扑功能图的关键因素:当相邻神经元的视野重叠度超过一定的阈值时,意味着相邻神经元接收的输入刺激相关性超过一定阈值,通过兴奋-兴奋局部突触可塑性驱动神经元形成等朝向区域(iso-orientation domains)并维持拓扑结构的连续性,但兴奋-抑制-兴奋局部环路因产生侧抑制而使得兴奋-兴奋神经元表征角度不同,进而实现拓扑结构的朝向覆盖性,最终通过竞争与协作生成风车中心;反之,较少的视野重叠度,则无法维持拓扑结构的连续性而则导致散乱的随机分布(图3a。这一发现首次将解剖学参数(如神经元密度、视网膜映射比例)与功能性拓扑结构直接关联,揭示了物种间视觉系统差异的演化逻辑。此外,风车结构通过平衡局部同向连接与抑制竞争,降低了网络布线成本(图3b,并提升了朝向功能图网络对图像输入的群体编码的高度稀疏性(图3c和高能效的编码成本-效率(图3b。该拓扑结构在自然图像噪声环境下的响应可靠性与盐胡椒模式相比,展现出更强的鲁棒性(图3d-e。最后,模型还进一步揭示了神经元密度与轴突连接范围对超柱尺寸的调控作用,并通过解剖学数据验证了“视网膜-V1映射比”可作为跨物种拓扑分类的线性判据(图4ab


3 a. 视觉输入的重叠度决定皮层神经元空间排布的差异性。b. 风车结构在演化过程中,降低了布线成本,提升了“成本-编码效率”。c. 提高了群体编码的稀疏性。d-e. 在输入刺激混入高斯白噪声时,比盐胡椒结构具有更强的鲁棒性。


4 基于感受野密度的线性分类器()可有效区分具有“盐胡椒”结构(如大鼠、小鼠、灰松鼠)与“风车”结构(如猕猴、雪貂、猫、树鼩)的物种。a. 该分类器反映了不同物种V1组织模式的差异。b. 以“V1神经元数量与视网膜面积之比”为分类依据的散点图表明,该比例为风车结构形成的关键阈值,高于该值的物种倾向于形成有序拓扑。


这一研究成果不仅阐明了视觉皮层功能图形成的可塑性突触机制,还首次在脉冲神经网络中建立了“结构-功能”的定量关联,为理解高效视觉编码的进化优势提供了基本理论框架。其揭示的“信息-成本效率”优化原则,在低功耗、高能效的视觉类脑计算模型算法的设计具有重要的启发价值。


感谢科技创新2030——“脑科学与类脑研究”重大项目(2021ZD0201301)以及国家自然科学基金(U20A20221、12201125、12072113)的支持。同时,感谢上海市科学技术委员会“上海优秀学术带头人计划”(21XD1400400)、“扬帆计划”(22YF1403300)以及中国博士后科学基金(2023M740724)的资助。


ICLR是机器学习和人工智能领域的四大顶级学术会议之一(h5 index = 304,在人工智能顶会h5排名中位居第二),全称为国际学习表征会议(International Conference on Learning Representations)ICLR每年举办一次,今年共收到11,672篇有效投稿,oralspotlight录用率为5.1%。会议将于2025424-28日在新加坡举行。