首页 > 其他分享> 文章详细

「李宏毅机器学习」机器学习介绍

2021-12-24 09:33:17 阅读：232 来源： 互联网

标签：function 机器李宏毅学习监督 Learning data

李宏毅机器学习系列文章目录

人工智能是人类长远以来的一个目标，而机器学习是实现这个目标的其中一种方法，深度学习则是机器学习的一种方法。

生物学知识告诉我们，生物的行为取决于两件事，一个是后天学习的结果，另外一个就是先天的本能。

在没有机器学习之前，人们是通过赋予机器先天的本能的方式来实现人工智能的，即通过编写hand-crafted rules的方式，更简单的说法就是给机器编写一些设定好的规则，让机器根据设定好的规则实现智能。

而使用hand-crafted rules的缺点是：

Hard to consider all possibilities
永远无法超越创造者
Lots off human efforts（not suitable for small industry）

以上缺点使得人们发明创造了machine learning的方法。

What is Machine Learning？

Machine Learning简单来说，就是你写一段具备学习能力的程序，这段程序并不是让机器具备做某些事情的能力（而是具备学习的能力），接下来可以像教小孩一样教会机器做某些事情。

Machine Learning所做的事情，其实就是寻找一个能解决问题的function（这个function过于复杂，人类无法直接写出），这个function的输入是使用者的input，输出则是机器的回应。

Machine Learning Framework

机器学习（监督学习，Supervised Learning）的整体框架大概如下：

左边的部分叫做training，就是学习的过程；右边的部分叫做testing，学好之后就可以拿去应用。

我们需要有一个function set，称之为model，里面有非常多的function。
通过一些训练数据，告诉机器一个好的function输入输出应该是怎样的，机器可以通过训练数据判断一个function是好还是不好。
同时，需要一个有效率的算法从function set中挑选出“最好”的function，称为\(f*\)。
找到\(f*\)之后我们可以将它应用在一些场景中。

Machine Learning Framework整个过程分为3个步骤（进行了细节的简化）：

找一个function
让machine可以衡量一个function好还是不好
让machine挑选出最好的function

Learning Map

本课程的Learning Map，其实也是机器学习的Learning Map。

scenario：学习的情景，通常这是我们无法控制的部分，采用什么方法其实主要取决于我们有什么样的data；
task：不同的问题，不同的task里面有不同的model；
method：解决问题的不同方法。

Task

机器学习的task可以分为几大类：

Regression：functin输出的是scalar（数值）
Classification：function输出的是类别
- Binary Classification：Yes/No
- Multi-class Classification：Class1, Class2, ...ClassN
Structured Learning：让机器输出结构性的东西。

Supervised Learning（监督学习）

监督学习需要大量的training data来告诉我们要找的function的input和output之间的关系，而这些output往往需要人工标注，称为label。因此监督学习的难点就在于收集大量有标签的训练数据。

Semi-supervised Learning（半监督学习）

半监督学习就能够减少label需要的量。

假如我们要做一个猫狗分类器，有少量猫和狗的labeled data，和大量猫和狗的unlabeled data，在半监督学习中，这些unlabeled data也是对学习有帮助的。

Transfer Learning（迁移学习）

另一种减少label的量的学习方法是迁移学习。

同样假设我们要做猫狗分类的问题，我们一样只有少量有label的data，但是我们还有大量的其他data，这些data可能有label也可能没有，而且这些data甚至跟我们要考虑的问题没什么特别的关系（并非猫狗），这些data能有什么帮助，这就是迁移学习要讲的问题。

Unsupervised Learing（无监督学习）

更加进阶的方法就是无监督学习，我们希望机器做到无师自通。让机器在没有任何label的情况下，只有输入，没有输出，看它到底能学到什么。

Reinforcement Learning（强化学习）

Supervised v.s. Reinforcement

Supervised：Learn from techer
Reinforcement：Learn from critics

在监督学习中，我们会告诉机器正确答案是什么，而在强化学习中，机器只能得到一个分数（结果），就是它做得好还是不好，但是不会告诉它那里正确哪里错误，它要自己反省检讨。监督学习更像学校中的学习，有一个老师告诉你正确的答案，而强化学习则更像真实社会的学习，没有人会告诉你正确的答案。

Alpha Go is supervised learning + reinforcement learning.

Why we need to learn Machine Learning？

AI有可能会取代大部分的工作，但是会出现一个新的工作，叫做AI训练师。

AI训练师需要挑选合适的model，loss function，不同的mode和loss function适合解决不同的问题。同时，有些model的最佳化（find the best function）比较困难，因此也需要经验丰富的训练师。

标签：function,机器,李宏毅,学习,监督,Learning,data
来源： https://www.cnblogs.com/zhanhong/p/15726030.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9