

让机器像大脑一样持续学习,一直是神经形态计算领域的核心目标。而挡在这条路上最顽固的障碍之一,是忆阻器那难以捉摸的"情绪化"电导跳变。
南京邮电大学凌海峰团队联合香港研究人员,近期在《自然通讯》发表了一项新研究,他们制造出一种内置氧浓度梯度的二阶忆阻器,借助这道人工梯度,器件的电导变化从过去随机突变式的"脾气",变成了缓慢、可预测、可控制的渐进过程。基于这款器件运行的强化学习算法,在静态任务中的训练迭代次数减少了近七成,在动态环境中也取得了显著提升。
忆阻器的老问题:学习路上的"随机地雷"
忆阻器的概念可以追溯到1971年华裔科学家蔡少棠的理论预言,其核心特性是能够记住流过自身的电荷历史,表现出类似生物突触的可塑性行为,因此长期被视为构建神经形态芯片的理想器件。
然而理想与现实之间,始终横着一道沟:大多数现有忆阻器的电导变化并不连续,而是以突发跳变的方式发生,本质上是器件内部导电细丝的突然形成或断裂所致。这种随机开关行为,对于需要稳定、渐进调整权重的学习算法来说,是灾难性的噪声。
"离子构型可能发生突变,通常是由于导电细丝的突然形成或断裂,这会导致随机开关行为和电导率的突变,"凌海峰在接受采访时直接点明了问题所在。
过去已有研究者尝试人工引入梯度结构来改善这一问题,但结果并不理想,因为反复的电操作会逐渐破坏梯度,导致器件性能随时间退化。
向细胞膜学来的"倾斜地形"
这个团队的解题路径,直接借鉴了生物学。

梯度驱动忆阻器可实现稳定的强化学习。图片来源:凌海峰。
活细胞利用跨膜离子浓度梯度建立静息电位,精确调控离子的定向缓慢流动,这正是神经元得以保存过去活动记忆、实现长时程可塑性的物理基础。研究人员希望在固态器件中重现这套机制。
他们设计了一种层叠结构:氧化铟锡作为底部电极,上面依次是锌卟啉分子层(ZnTPP)、原子层沉积氧化铝(ALD-AlOₓ)和铝顶电极。其中ZnTPP分子层是这套设计的关键。
在制造阶段,ZnTPP为氧化铝的原子层沉积提供化学活性位点,使界面区域富含氧元素,从而在氧化层内部自然形成一道固有的氧浓度梯度,而非事后人工添加。在器件工作阶段,ZnTPP还参与与氧离子的可逆配位相互作用,持续稳定界面电场,防止梯度在反复操作中被侵蚀消除。
凌海峰用一个形象的比喻解释这道梯度的作用:"如果没有梯度,离子运动就像一个球在平面上滚动。有了梯度,系统的行为更像是在一个倾斜的地形上,引导离子朝着可预测的方向运动。"
实验结果印证了这一设计的有效性。该器件在电刺激后的电导弛豫时间超过100秒,远长于其他二阶忆阻器典型的纳秒级衰减,并且在40个不同的伪非易失性电导状态之间展现出高达98.1%的调制范围,各状态在时间上清晰可分辨。
研究团队还配套开发了一种名为"单极尖峰电压依赖可塑性"(U-SVDP)的脉冲调制方案,通过施加不同幅度的脉冲对,精确平衡氧离子沿梯度方向的漂移与扩散,从而实现对器件状态的主动精确控制。
这40个电导状态随后被映射为Q学习强化学习算法的动态学习率,由相邻状态之间的相对电导变化计算得出。在静态路径寻找任务中,与传统方法相比,训练迭代次数减少了68.75%;在复杂度逐步递增的动态环境中,减少幅度为35.65%,动态场景下的提升相对有限,研究者坦承这反映了当前器件时间动态特性仍相对固定的局限。
从更宏观的视角看,这项工作的意义在于它在器件物理层面为神经形态计算的持续学习难题提供了一条新路径:不是通过软件算法去弥补硬件的随机性,而是从器件结构设计源头消除随机性,让学习的稳定性直接由材料的物理特性来保障。随着神经形态芯片的规模化集成需求日益迫切,这类将生物机制真正落地为硬件特性的研究,正在变得越来越重要。
长红配资提示:文章来自网络,不代表本站观点。