ICode9

精准搜索请尝试：精确搜索

Java

PHP

Coordinated Proximal Policy Optimization (CoPPO)2022-06-20 22:04:26

Coordinated Proximal Policy Optimization (CoPPO) 2111.04051 摘要：提出了CoPPO。关键想法是，在对不同智能体进行策略更新时，对步长进行coordinated adaptation。证明了策略提升的单调性。基于一些近似，推导出了简化的优化目标。这样的一个优化目标，会实现智能体之间的

关于我们 | 联系我们 | 留言反馈

专注分享技术，共同学习，共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有