编者按 :本文来自微信公众号 新智元(ID :AI_era),人造创业邦经授权转载 ,太阳突破头图来源摄图网一旦人类掌握了可控核聚变能 ,精准将可拥有无穷不尽的放电发现清洁能源 。广告可御可甜 有颜有料 惩罚整蛊任你选 >>进入直播间与主播亲密互动×要知道,实现山西生生反馈控制对于「托卡马克装置」的可控运行至关重要。而控制系统会主动管理磁线圈,核聚婚以控制拉长离子体的变新被活不稳定性,防止破坏性的位岁垂直事件发生。此外,女孩人类若能实现对等离子体电流、配冥位置和形状的察找精确控制,还可以实现热排放,已死甚至对其能量的合葬管理。一直以来 ,人造科学家们致力于研究等离子体配置变化对这些相关量的影响。因此就需要能够用于新配置,以及围绕标称场景快速变化的系统。传统上,等离子体的精确控制是通过等离子体电流、形状和位置的连续闭环来实现的。在这种模式下 ,控制设计者预先计算出一组前馈线圈电流 ,然后为每个受控量建立反馈回路 。等离子体形状和位置无法直接测量,必须通过磁场测量实时间接估算 。尤其是等离子体的形状,必须使用平衡重构代码进行实时估算。虽然这类系统已成功稳定了大范围的放电,但其设计不仅具有挑战性,还耗时 ,特别是针对新型等离子体情况 。值得一体的是 ,强化学习(RL)已成为构建实时控制系统的另一种全新范式 。2022年,DeepMind团队登上Nature的一篇论文表明 ,RL设计的系统能够成功实现「托卡马克磁控制」的主要功能。论文地址 :https://www.nature.com/articles/s41586-021-04301-9这项工作提出了一个系统 ,RL智能体通过与FGE 托卡马克模拟器交互 ,学习控制托卡马克配置变量(TCV) 。智能体学习的控制策略随后被集成到TCV控制系统中 ,通过观察TCV的磁场测量,并为所有19个磁控线圈输出控制指令。尤其,研究人员展示了RL智能体控制各种情况的能力 ,包括高度拉长的等离子体、雪花