就像生物网一样「生长」,具备「结构可塑性」自组织神经网络来了——人工智能

首页 2024-07-09 10:20:23

生物神经网络一个重要的特点是高可塑性,使自然生物具有优异的适应性,影响神经系统的突触强度和拓扑结构。

然而,人工神经网络主要设计为静态和完全连接的结构,面对不断变化的环境和新的输入可能非常脆弱。虽然研究人员对在线学习和元学习进行了大量的研究,但最先进的神经网络系统仍然使用离线学习,因为它更容易与反向传播相结合。

那么,人工神经网络也能具有类似于高可塑性的性质吗?

哥本哈根信息技术大学的研究小组提出了自组织神经网络 ——LNDP,突触和结构的可塑性可以通过活动和奖励来实现。

  • 论文链接:https://arxiv.org/pdf/2406.09787

  • 项目链接:https://github.com/erwanplantec/LNDP

研究简介

2023 年,Najarro 其他人提出了神经发育程序(NDP)模型。但 NDP 时间限制在环境的早期阶段。因此,哥本哈根信息技术大学的研究团队扩大了 NDP 为了解决这个限制,框架。

具体来说,研究团队提出了在智能生命周期内实现可塑性和结构变化的机制 ——LNDP(Lifelong Neural Developmental programs)。该机制依赖于人工神经网络中每个神经元的局部活动和环境的全局奖励函数。LNDP 使人工神经网络具有可塑性,并桥接间接开发编码(indirect developmental encoding)和元学习的可塑性规则。

LNDP 它由一组参数组件组成,旨在定义神经和突触动态,使人工神经网络具有结构可塑性(即突触可以动态添加或删除)。

受生物自发活动影响(spontaneous activity,SA)受此启发,研究团队进一步扩大了系统,并引入了可实现的预经验(pre-experience)发展机制可以通过简单的感觉神经元学习随机过程建模 SA,这使得一些组件可以重用。

基于研究团队 Graph Transformer 层(Dwivedi and Bresson, 2021)提出了一种 LNDP 例如,协方差矩阵自适应进化策略用于一组强化学习任务(CMA-ES)优化了 LNDP。

具体来说,该研究采用了三个经典的控制任务(Cartpole、Acrobot、Pendulum)以及具有不稳定动态的收集任务(Foraging),这类任务要求智能体具有生命周期的适应性。

一般来说,研究团队从随机连接(或空)神经网络开始, LNDP 通过依赖活动和经验,自组织地形成功能网络,有效地解决控制任务。

该研究还表明,结构可塑性可以改善需要快速适应或不稳定动态和持续适应的环境中的结果。此外,该研究还显示了基于预环境自发活动驱动的网络自组织功能单元发展阶段的有效性。

实验结果

研究团队测试了所有任务 SP 模型(结构可塑性模型)和非结构可塑性模型 SP 模型(无结构可塑性模型)之间的差异如下图所示 2 所示。

在具有不稳定动态的收集任务中(Foraging)上,研究团队发现了 SP 模型总是比非 SP 该模型具有较高的平均适应性,并且两者具有相似的最大适应性。这说明 SP 在不稳定的情况下有更好的适应性。

在 CartPole 在环境中,没有 SA 就模型而言,一开始就很难达到良好的性能 SA 该模型最初显示了解决任务的固有技能。这显示了该模型在非奖励依赖和自组织的方式下实现目标功能网络的能力。

更多研究细节,请参考原论文。

以上就像生物网一样「生长」,具备「结构可塑性」更多关于自组织神经网络的详细信息,请关注其他相关文章!


p