近日,上海交通大学电子信息与电气工程学院曾贵华团队在Nature伙伴期刊NPJ Quantum Information上发表了题为“Parameter estimation in quantum sensing based on deep reinforcement learning”(基于量子深度强化学习的传感参数估计)的研究论文,在智能量子传感方向取得进展。
研究背景
传感技术在众多领域具有重要应用,受到广泛关注。量子传感是量子信息科学三大核心方向(量子通信、量子计算、量子传感)中的重要方向之一,其核心任务是:利用量子纠缠、量子不确定性等量子物理属性,实现对未知环境参数更高精度、更高灵敏度、更高分辨率的感知,并使之逼近或超越物理极限。近年来,国内外学者在非时变量子传感技术方面取得了良好进展,但是时变系统的量子感知,特别如何在时变系统中逼近量子速度极限ΔE/Δt(Quantum Speed Limit, QSL),一直是挑战性问题。
研究成果
针对这个问题,曾贵华带领的量子感知与信息处理研究所(QSIP)独创性提出基于量子调控的量子深度强化学习协议,解决时变过程参数估计的精度饱和问题,达到量子速度极限QSL,为实现时变系统的量子感知精度极限提供支撑。具体来说,利用强化机器学习方法,提出一种通用的量子强化学习传感协议,协议结构如图1所示。该协议从几何视角给出时变参数估计的量子费舍尔信息不等式,并证明传统方案只能达到次优解;随后提出线性时间耦合量子调控拟设与基于量子费舍尔信息的奖励函数,统一时变与非时变量子传感参数估计的量子机器学习调控机理。针对单粒子时变量子系统,分别采用薛定谔方程和量子主方程刻画理想和含噪量子系统的时间演化过程,解决时变量子系统中的量子传感参数估计及其快速逼近量子速度极限的问题,实验结果如图2所示。
图1 量子深度强化学习传感参数估计协议
图2 量子深度强化学习量子传感参数估计饱和量子速度极限
本工作提出的协议不但有效解决时变系统的高精度感知问题,而且能够有效克服系统的非完美效应,求解全局最优的量子调控序列,使得量子传感器的参数估计精度可快速饱和至量子速度极限,具备全局最优、抗噪声能力好与普适性强等特点。所构建的方法在高精度传感技术中具有重要应用前景和实际应用价值。
完成人
该工作由上海交通大学、北卡罗来纳州立大学合作完成,上海交通大学为第一完成单位,博士研究生肖太龙为第一作者,曾贵华为唯一通讯作者。该研究工作得到国家科技部重点研发计划、国家自然科学基金重点项目、上海市量子科技重大专项等重要项目的资助。