# Lecture 1:概括与基础 和 supervised learning 的区别: * 强化学习是Sequential data作为input,每次输入并不是独立同分布 * 没有ground truth, learner不会被告知什么action是正确的。需要不断去尝试 * Trail-and-error exploration(balance between explioration and exploita
专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]
Copyright (C)ICode9.com, All Rights Reserved.
ICode9版权所有