面向智能博弈的决策 Transformer 方法综述

这篇具有很好参考价值的文章主要介绍了面向智能博弈的决策 Transformer 方法综述。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

源自：指挥与控制学报

作者：罗俊仁张万鹏苏炯铭王尧陈璟

摘要

智能博弈是认知决策智能领域的挑战性问题, 是辅助联合作战筹划与智能任务规划的关键支撑. 从协作式团队博弈、竞争式零和博弈和混合式一般和博弈共 3 个角度梳理了智能博弈模型, 从认知角度出发定义了运筹型博弈（完全 / 有限理性）、不确定型博弈（经验 / 知识）、涌现探索型博弈（直觉 + 灵感）、群体交互型博弈（协同演化）共 4 类智能博弈认知模型, 从问题可信任解、策略训练平台、问题求解范式共 3 个视角给出智能博弈求解方案. 基于 Transformer 架构重点梳理了架构增强（表示学习、网络组合、模型扩展）与序列建模（离线预训练、在线适变、模型扩展）共 2 大类 6 小类决策 Transformer 方法, 相关研究为开展“离线预训练 + 在线适变”范式下满足多主体、多任务、多模态及虚实迁移等应用场景的决策预训练模型构建提供了初始参考. 为智能博弈领域的决策基石模型相关研究提供可行借鉴.