ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

机器学习的基本概念

2022-04-09 15:02:33  阅读:174  来源: 互联网

标签:机器 模型 建模 学习 拟合 集上 数据 基本概念


基本概念:

有监督学习,无监督学习,机器学习的分类,回归,什么情况过拟合,什么情况下欠拟合。

机器学习最常见的算法:

K最近邻算法,线性模型,朴素贝叶斯,决策树,随机森林,SVMs,神经网络。

不同的算法在不同的数据集上的表现不同。

主要任务是:建模,模型参数调整

建模的基础:数据进行降维,聚类,算法建模,数据处理,找到合适的模型,模型最优参数,

有监督学习:

通过对现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。训练数据集包含样本特征和分类标签,算法模型通过数据推断出分类,并应用到新样本中。

无监督学习:

对没有标签的训练数据集的数据进行分析并建模,主要是两类任务类型:数据转换(数据降维去除无关特征变量保留关键特征变量)和聚类分析(把样本划到不同分组的算法)

分类和回归是有监督学习中两个最常见的方法

分类:机器学习的目标是对样本的类标签进行预测,判断属于哪个分类,结果是离散的数值

回归分析:其目标要预测一个连续的数值或者范围

模型的泛化:有监督学习中,在训练数据集上建立一个模型,再把这个模型用于新的数据。希望模型对新数据的预测是准确的,这叫泛化的准确度。

过拟合:用测试数据集对模型表现进行评估,如果模型复杂在训练数据集上表现很好,但是在测试数据集上表现差,模型出现了过拟合。

欠拟合:模型过于简单,训练集上的数据特征都不能完全考虑到,这样的模型在训练数据集和测试数据集得分都较差,这叫欠拟合。

标签:机器,模型,建模,学习,拟合,集上,数据,基本概念
来源: https://www.cnblogs.com/yeskey/p/16122020.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有