高估

不要高估自己要踏实，写给自己2022-08-18 23:04:09

我发现有很多很多的人是高估自己的。最典型的就是相亲市场，为什么现在结婚率如此低，有个重要的因素就是，对自己没有一个正确的认识。自己爱的人都是自己配不上的，而能和你结婚的人都是自己看不上的，所以就很不甘心，一直寻寻觅觅寻寻觅觅。工作中生活中这种人也很多，自以为有多聪明，觉得自
Deep Reinforcement Learning with Double Q-learning2022-02-18 15:35:35

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ AAAI 2016 Abstract 　　众所周知，流行的Q学习算法会在某些条件下高估动作价值。以前不知道在实践中这种高估是否普遍，它们是否会损害性能，以及它们是否通常可以避免。在本文中，我们肯定地回答了所有这些问题。特别是，我
第四周总结2022-02-06 10:02:30

啥也没干，我是废物但是我好想去远方啊想去看远方的花，去认识更多有趣的人，北方的雪我一度觉得我受够了当下的无能为力，但还是高估了自己的自制力幻想的世界很美好但还是得回归现实
DQN 笔记 double DQN2021-11-30 13:02:44

1 DQN的问题在DQN 笔记 State-action Value Function(Q-function)_UQI-LIUWJ的博客-CSDN博客中，我们知道DQN的学习目标是但是，这个Q的值是被“高估”了的。因为每一次策略Π更新的时候，Π(s)都取的是最大的那个action，也即然而，实际网络环境中，
DQN高阶技巧2021-07-30 20:01:37

bootstrapping：左脚踩右脚上升。用一个估算去更新同类的估算。 DQN的高估问题：TD算法导致DQN高估真实的动作价值。以下两个原因导致DQN出现高估： TD target：\(y_t = r_t + \gamma \cdot \mathop {max}\limits_aQ^*(s_{t+1},a;w)\)，其中的最大化操作会使得\(y_t\)被高估；数学理解：给一
060321流水账2021-06-04 11:34:07

昨天有前辈建议我学WPF，非常开心能有前人指路。今天上午有些事请假了，所以才来公司来公司之后先回复了前辈，然后上网查了查WPF。昨天用了一天的时间总算把SQL语言的课听完了。还差一节，这就去听我听的是这个链接：https://www.bilibili.com/video/BV1Xo4y127TA?t=359&p=58 想把这些下

ICode9

不要高估自己要踏实，写给自己2022-08-18 23:04:09

Deep Reinforcement Learning with Double Q-learning2022-02-18 15:35:35

第四周总结2022-02-06 10:02:30

DQN 笔记 double DQN2021-11-30 13:02:44

DQN高阶技巧2021-07-30 20:01:37

060321流水账2021-06-04 11:34:07