面向遗传模糊推理的随机策略转化方法

标题：面向遗传模糊推理的随机策略转化方法

摘要：本发明公开了一种面向遗传模糊推理的随机策略转化方法，包括：假设模糊推理树所代表的策略用π(s, θ)＝a表示，由于模糊推理树是由多个模糊推理系统组成，因此，将策略改写成π(s, FISi(θii))＝a；设定输出动作action为分布采样形态；利用第i个输出节点FISouti构建动作分布参数，形成动作生成分布；利用分布采样技术输出相应的动作。本发明能够解决GFT算法模型在零和博弈中不能保证收敛到纳什均衡的问题，通过将GFT由确定性策略转化为随机策略，使其经过充分的自博弈训练之后具备收敛到纳什均衡的能力。

申请号：CN201810797815.5

申请日：2018/7/19

申请人：中国航空工业集团公司沈阳飞机设计研究所

首项权利要求：1.一种面向遗传模糊推理的随机策略转化方法，其特征在于，包括模糊推理树所代表的策略用π(s, θ)＝a表示，将所述模糊推理树所代表的策略改写成π(s, FISi(θi))＝a；
设定输出动作action为分布采样形态；
利用第i个输出节点FISouti构建动作分布参数，形成动作生成分布；
利用分布采样技术输出相应的动作；
其中，s为模糊推理树的输入量全集，a为为模糊推理树经过随机策略转化最终输出的动作值，θi为模糊推理树中第i个模糊推理系统所包含的参数，FISi(θi)为模糊推理树第i个输出节点取值，π(s, FISi(θi))为以一定的概率阈值并且以FISi(θi)作为分布参数进行采样。

专利类型：发明申请

/0 评论/作者：

面向遗传模糊推理的随机策略转化方法

发表评论

发表评论取消回复

发表评论

发表评论 取消回复

发表评论取消回复