首页 > 其他分享> 文章详细

李宏毅机器学习笔记（一）概论

2021-04-05 21:57:26 阅读：184 来源： 互联网

标签：机器 Learning 李宏毅笔记学习 supervised learning 函式概论

学习目录

一、机器学习是什么?

机器学习的本质就是自动寻找函式

二、你想找什么样的函式？

1.regression（回归）：

函数的输出是一个数值
比如PM2.5的预测，给machine的training data是过去的PM2.5资料，而输出的是对未来PM2.5的预测数值，这就是一个典型的regression的问题
在这里插入图片描述

2.classfication（分类）：

1）Binary Classification(二元分类):
输出只有两个可能
在这里插入图片描述
2）multi-class Classification(多层次分类):
输出是让机器做选择题，从N个选项中做出正确的选择

3.generation（生成）：

让机器生成有结构的复杂东西（例如：句子、图片），让机器学习怎么创造这些东西。

三、怎么告诉机器你想找什么样的函式？

1. supervised learning (有监督学习)：

监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中，每个实例都是由一个输入对象（通常为矢量）和一个期望的输出值（也称为监督信号）组成。监督学习算法是分析该训练数据，并产生一个推断的功能，其可以用于映射出新的实例。
在这里插入图片描述

1）函式的loss：预测结果的出错率。用来估量模型的预测值f(x)与真实值Y的不一致程度，损失函数越小，模型的鲁棒性就越好。

2. unsupervised learning(无监督学习)：

区别于supervised learning，unsupervised learning希望机器学到无师自通，在完全没有任何label（标记）的情况下，机器到底能学到什么样的知识

3. reinforcement learning（强化学习）:

强化学习属于无监督学习，机器不知道正确答案，只知道自己做得好还是不好，但是机器不知道自己哪里做的不好，机器要自己想办法解决。引导机器学习的方向。

其实Alpha Go是用supervised Learning+reinforcement Learning的方式去学习的，机器先是从棋谱学习，有棋谱就可以做supervised的学习；之后再做reinforcement Learning，机器的对手是另外一台机器，Alpha Go就是和自己下棋，然后不断的进步

4.transfer learning（迁移学习）:

在这里插入图片描述
训练数据跟测试数据的类型不一样的，例如以黑白图片训练识别数字，测试时使用了彩色图片，如何使机器也能输出正确的结果。
Transfer Learning要解决的问题是，这一堆不相干的data可以对结果带来什么样的帮助

5.meta learning（元学习）：

学习如何学习
在这里插入图片描述

6.life-long learning（终身学习）：

终身学习，不停学习
在这里插入图片描述
学习视频：李宏毅2020机器学习
部分学习笔记参考网络上优秀的解释，仅供自用学习记录。

标签：机器,Learning,李宏毅,笔记,学习,supervised,learning,函式,概论
来源： https://blog.csdn.net/m0_45175511/article/details/115448329

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9