← 返回
基于AAV辅助协同干扰的认知无线电网络物理层安全增强:一种MAPPO-LSTM深度强化学习方法
Physical Layer Security Enhancement in AAV-Assisted Cooperative Jamming for Cognitive Radio Networks: A MAPPO-LSTM Deep Reinforcement Learning Approach
| 作者 | Jun Wang · Rong Wang · Zibin Zheng · Ruiquan Lin · Liang Wu · Feng Shu |
| 期刊 | IEEE Transactions on Vehicular Technology |
| 出版日期 | 2024年10月 |
| 技术分类 | 储能系统技术 |
| 技术标签 | SiC器件 强化学习 |
| 相关度评分 | ★★★★★ 5.0 / 5.0 |
| 关键词 | 认知无线电 能量收集 物理层安全 自主飞行器 安全通信率 |
语言:
中文摘要
认知无线电(CR)和能量收集(EH)技术为缓解频谱利用效率低下和能量存储容量有限等问题提供了思路。在认知无线电网络中,安全威胁,尤其是来自窃听者的威胁,可能导致信息泄露。本研究聚焦于通过自主飞行器(AAV)进行协作干扰,以提高具有能量收集功能的多用户物理层安全(PLS),从而最大化安全通信速率。在AAV辅助的EH - CR系统中,如果次用户(SUs)向主用户(PU)发送的协作干扰功率低于一定阈值,次用户就可以使用主用户占用的授权频谱频段。次用户可以从主发射机(PT)收集并使用射频(RF)能量。AAV干扰器通过发射干扰信号来干扰窃听者,从而减少被窃取的信息,以优化长期安全通信性能。本文在考虑系统约束的情况下,构建了最大化平均安全通信速率的问题,并联合优化AAV轨迹、发射功率和能量收集系数。由于该问题是非凸的,因此将其重新表述为马尔可夫决策过程(MDP)。本文采用多智能体近端策略优化(MAPPO)算法来解决该问题,引入反事实基线来处理集中式学习中的信用分配问题,并集成长短期记忆(LSTM)网络以增强序列样本数据的学习能力,从而提高算法的训练效率和效果。仿真结果证明了所提方法在最大化系统安全通信速率方面的有效性和优越性。
English Abstract
Cognitive Radio (CR) and Energy Harvesting (EH) techniques have offered insights to mitigate issues related to inefficient spectrum utilization and limited energy storage capacity. In Cognitive Radio Networks, security threats, particularly from eavesdroppers, may result in information leakage. This study focuses on enhancing the Physical Layer Security (PLS) of multi-users with EH by employing cooperative jamming via a Autonomous Aerial Vehicle (AAV) to maximize the secure communication rate. In the AAV-assisted EH-CR system, Secondary Users (SUs) can utilize the licensed spectrum band occupied by a Primary User (PU) if the cooperative jamming power from SUs to the PU remains below a certain threshold. SUs can harvest and use Radio Frequency (RF) energy from the Primary Transmitter (PT). The AAV jammer disrupts the eavesdropper by transmitting jamming signals, thereby minimizing stolen information to optimize long-term secure communication performance. The paper formulates the problem of maximizing the average secure communication rate while considering system constraints and jointly optimizes the AAV trajectory, transmission power, and EH coefficient. As the problem is non-convex, it is reformulated as a Markov Decision Process (MDP). The paper employs the Multi-Agent Proximal Policy Optimization (MAPPO) algorithm to address the problem, introduces counterfactual baselines to tackle the credit assignment problem in centralized learning, and integrates the Long Short-Term Memory (LSTM) network to enhance the learning capability of sequential sample data, thereby improving the training efficiency and effectiveness of the algorithm. Simulation results demonstrate the effectiveness and superiority of the proposed method in maximizing the system's secure communication rate.
S
SunView 深度解读
从阳光电源的业务视角来看,该论文提出的认知无线电网络物理层安全增强技术与公司在分布式能源管理和智能通信系统方面存在潜在协同价值。
**业务相关性分析**:论文中的能量收集(EH)技术与阳光电源的储能系统业务高度契合。在大规模光伏电站和储能电站的运营中,分布式设备间的安全通信至关重要。该研究提出的射频能量收集机制可为远程监控设备、传感器节点提供辅助供电方案,降低电站运维成本。认知无线电技术能够动态利用频谱资源,这对于阳光电源在偏远地区部署的光伏电站通信网络具有实际意义,可缓解专用频段资源紧张问题。
**技术价值评估**:物理层安全增强技术可显著提升阳光电源智能电站的数据传输安全性。当前光伏逆变器、储能系统的运行数据、电网调度指令等敏感信息面临窃听风险,该技术通过无人机协同干扰机制,为关键数据传输提供额外的安全防护层。MAPPO-LSTM深度强化学习算法的应用展示了智能决策在复杂电磁环境下的优化能力,这与阳光电源推进的AI驱动能源管理方向一致。
**应用挑战与机遇**:技术成熟度方面,该方案仍处于理论验证阶段,工程化应用需解决无人机续航、恶劣天气适应性等实际问题。但对于阳光电源而言,这为开发"通信+安全+能源"一体化解决方案提供了创新思路,特别是在海外高安全需求市场(如军用微网、关键基础设施)具有差异化竞争优势。建议关注该技术与公司现有iSolarCloud云平台的集成可能性,探索边缘计算与安全通信的融合应用场景。