ICode9

精准搜索请尝试: 精确搜索
  • 强化学习笔记(周博磊)2022-06-25 01:32:36

      # Lecture 1:概括与基础 和 supervised learning 的区别: * 强化学习是Sequential data作为input,每次输入并不是独立同分布 * 没有ground truth, learner不会被告知什么action是正确的。需要不断去尝试 * Trail-and-error exploration(balance between explioration and exploita

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有