ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

狭义的数据分析与数据挖掘。统计学,机器学习

2021-11-03 20:02:35  阅读:229  来源: 互联网

标签:数据分析 机器 学习 统计学 数据挖掘 数据


一.数据分析:数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。

数据分析的过程可以大致分为:数据获取--数据清洗--数据处理--数据建模--分析结果呈现几个阶段。

1.数据获取:这个阶段的输出是一个数据子集(原始数据集的部分观察或者变量),困难之处在于理解相关的数据源

2.数据处理:对数据进行汇总,或者形式上的变换.编码的替换等。

3.数据建模:用于统计分析或机器学习算法对数据建模,以便描述数据或对未来进行预测。

4.分析结果呈现:把建模的结果以图.表或者更加复杂的可视化方式呈现出来。

数据挖掘:数据挖掘指的是在大型的数据库中对有价值的信息只是进行获取。具体的说,数据挖掘就是通过对海量的.杂乱无章的.不清晰的并且随机性很大的数据进行挖掘,找到其中蕴含的有规律并且有价值和能够理解应用的知识。数据挖掘的方法有两种:一种是分类分析,一种是聚类分析

分类分析:需要找到数据之间的依赖关系,并且进行预判输出离散类别。

聚类分析:先对数据进行初试归类,之后去粗取精进行合并,最后使得对象之间彼此联系归于一类。

区别与联系:数据分析更多采用统计学的知识,对源数据进行描述性和探索性分析,从结果中发现价值信息来评估和修正现状。而数据挖掘不仅仅用到统计学的知识,还要用到机器学习的知识,这里会涉及到模型的概念。数据挖掘具有更深的层次,来发现未知的规律和价值。

二.统计学:统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。

   机器学习:机器学习是一门多学科交叉专业,对它的定义有以下三种

(1)机器学习是一门人工智能的科学,该领域的主要研究对象人工智能,特别是如何在经验学习中改善具体算法的性能。

(2)机器学习是对能通过经验自动改进的计算机算法的研究。

(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准

在大数据方面,机器学习对数据的转换,数据的处理数据的存储等带来了更好的技术支持,产业升级和新产业诞生形成了一种推动力量,让大数据能够针对可发现事物的程序进行自动规划,实现人类用户以计算机信息之间的协调。

区别与联系:统计学更多的是一种分析能力,建立在大量的数据中的一种推测方法,是一种数据研究,若无数据则无法处理,更多的是一种预测。而机器学习通常会牺牲可解释性以获得强大的预测能力,机器学习基于统计的框架,因为机器学习涉及数据,而数据必须基于统计学框架来进行描述。

标签:数据分析,机器,学习,统计学,数据挖掘,数据
来源: https://blog.csdn.net/weixin_62604687/article/details/121063684

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有