ICode9

精准搜索请尝试: 精确搜索
  • MAPPO学习笔记(1):从PPO算法开始2022-06-19 03:01:14

    由于这段时间的学习内容涉及到MAPPO算法,并且我对MAPPO算法这种多智能体算法的信息交互机制不甚了解,于是写了这个系列的笔记,目的是巩固知识,并且进行一些粗浅又滑稽的总结。   1.PPO算法的介绍 1.1.PG算法 如果要分类的话,根据学习方法的不同,可以将强化学习分为Value-based方法、Pol

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有