HASH GAME - Online Skill Game GET 300
专利摘要显示,本发明属于无人机任务规划与调度领域,公开了一种基于注意力机制的深度强化学习的多无人机多任务规划方法,旨在解决传统方法在处理高复杂度、大规模任务规划问题时所面临的低效难题。本发明方法包括以下步骤:S1.任务分解与初始分配;S2.建立多无人机任务规划数学模型;S3.建立马尔可夫决策过程;S4.设计掩码策略下的基于注意力机制的深度强化学习模型;S5.结合蜻蜓算法和REINFORCE算法进行策略优化更新;S6.以训练后的模型对多无人机进行任务规划。本发明在面对高复杂度、多约束的大规模任务场景时,相比其它算法计算时间更短,规划结果更高效,并且规模越大对比效果越明显,在不同任务数环境下均能取得较好的效果,其泛化能力更强。