首页 > 其他分享> 文章详细

机器学习的实现和方法论

2021-02-15 13:01:11 阅读：141 来源： 互联网

标签：方法论机器函数假设模型学习算法

术语回顾：
机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”（model）的算法，即学习算法（learning algorithm）。
假设 (hypothesis)：学习模型对应了关于数据某种潜在的规律。

实现：训练和预测

归纳与演绎是科学推理的两大基本手段，类似的，实现机器学习也可以分成两步：训练（归纳）和预测（演绎）。

归纳（induction）：从特殊到一般的“泛化”过程，即从具体的事实归纳总结（抽象）出一般性规律。机器学习中的“训练”是从一定数量的样本（已知模型输入X和模型输出Y）中，学习输出Y与输入X的关系（可以想象成是某种表达式、映射）。
演绎（deduction）：从一般到特殊的“特化”过程，即从一般性规律推导出具体案例的结果。机器学习中的“预测”是基于训练得到的Y与X之间的关系，计算输出新样本对应的Y。通常情况下，如果通过模型计算的输出和真实场景的输出一致，则说明模型是有效的。

可以把机器学习过程看作一个在所有假设（hypothesis）组成的空间中进行搜索的过程，搜索目标是找到与训练集“匹配fit”的假设。
如果发现了多个“假设”，到底应该选择哪个呢？
奥卡姆剃刀原则：若有多个假设与观察一致，则选最简单的那个。

方法论

机器学习模型构成的三个部分是模型假设、评价函数（损失/优化目标）和优化算法。

模型假设
世界上的可能关系千千万，漫无目标的试探Y与X之间的关系显然是十分低效的。因此在假设空间先圈定一个模型能够表达的关系可能，比如：假设y和x是线性关系，即y=w⋅x+b。然后进一步寻找最优的Y~X关系，即确定参数w和b
评价函数（损失函数、优化目标）
寻找最优之前，我们需要先定义什么是最优，即评价一个Y~X关系的好坏的指标。通常衡量该关系是否能很好的拟合现有观测样本，将拟合的误差最小作为优化目标。
优化算法
设置了评价指标后，就可以在假设圈定的范围内，将使得评价指标最优（损失函数最小/最拟合已有观测样本）的Y~X关系找出来，这个寻找的方法即为优化算法。

假定f是最终期望的"公式"函数，g是当前公式所拟合的函数。那么，机器学习的目的就是让假设g更加逼近期望目标f。
使用数据去计算假设g去逼近目标f
未知目标函数f产生了一些训练样本D，从假设集合H中，通过学习算法A找到一个函数g，g能够最大程度的拟合训练样本D，那么可以认为函数g就接近于目标函数f。

附：人工智能、机器学习与深度学习

概括来说，人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的。人工智能是最宽泛的概念。机器学习是当前比较有效的一种实现人工智能的方式。深度学习是机器学习算法中最热门的一个分支，近些年取得了显著的进展，并替代了大多数传统机器学习算法。三者的关系如图1 所示，即：人工智能 > 机器学习 > 深度学习。
三者关系示意
如字面含义，人工智能是研发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。由于这个定义只阐述了目标，而没有限定方法，因此实现人工智能存在的诸多方法和分支，导致其变成一个“大杂烩”式的学科。

参考引用：周志华机器学习和飞桨学习平台-机器学习和深度学习综述

标签：方法论,机器,函数,假设,模型,学习,算法
来源： https://blog.csdn.net/weixin_44153121/article/details/113815056

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

机器学习的实现和方法论

实现：训练和预测

方法论

附：人工智能、机器学习与深度学习