一种自我策略迭代吸收的GFT智能决策模型自搏训练方法
标题:一种自我策略迭代吸收的GFT智能决策模型自搏训练方法
摘要:本发明提供一种自我策略迭代吸收的GFT智能决策模型自搏训练方法,如下步骤:从自搏训练的第N代开始,对前N代的GFT算法模型的策略对抗能力进行排序;挑选出最好的n个GFT算法模型,进行组合,保证n个权值的总和为1,形成第N代的组合GFT;选用启发式优化方法,在策略对抗中对n个总和为1的GFT的权值进行优化,得到优化后的n个权值;对n个权值进行排序,删除其中权值较小的m个GFT,m<
发表评论