面向遗传模糊推理的随机策略转化方法

标题:面向遗传模糊推理的随机策略转化方法

摘要:本发明公开了一种面向遗传模糊推理的随机策略转化方法,包括:假设模糊推理树所代表的策略用π(s, θ)=a表示,由于模糊推理树是由多个模糊推理系统组成,因此,将策略改写成π(s, FISi(θii))=a;设定输出动作action为分布采样形态;利用第i个输出节点FISouti构建动作分布参数,形成动作生成分布;利用分布采样技术输出相应的动作。本发明能够解决GFT算法模型在零和博弈中不能保证收敛到纳什均衡的问题,通过将GFT由确定性策略转化为随机策略,使其经过充分的自博弈训练之后具备收敛到纳什均衡的能力。

申请号:CN201810797815.5

申请日:2018/7/19

申请人:中国航空工业集团公司沈阳飞机设计研究所

首项权利要求:1.一种面向遗传模糊推理的随机策略转化方法,其特征在于,包括模糊推理树所代表的策略用π(s, θ)=a表示,将所述模糊推理树所代表的策略改写成π(s, FISi(θi))=a;
设定输出动作action为分布采样形态;
利用第i个输出节点FISouti构建动作分布参数,形成动作生成分布;
利用分布采样技术输出相应的动作;
其中,s为模糊推理树的输入量全集,a为为模糊推理树经过随机策略转化最终输出的动作值,θi为模糊推理树中第i个模糊推理系统所包含的参数,FISi(θi)为模糊推理树第i个输出节点取值,π(s, FISi(θi))为以一定的概率阈值并且以FISi(θi)作为分布参数进行采样。

专利类型:发明申请

0 条回复

发表评论

发表评论

邮箱地址不会被公开。