标签:02 数据库 神经网络 领域 挖掘 算法 数据挖掘 方法
- 5 数据挖掘与相关方法
学好大数据是为了 点亮人工智能的路!
知识发现与数据挖掘充分体现了各种方法论的相互交叉,渗透和协作
与数据挖掘最为密切的领域是 模式识别 、机器学习 、大数据分析…b.
我们可以从挖掘任务
、挖掘对象
、挖掘方法
等角度对挖掘技术
进行分类:
-
按挖掘任务分类: 包括分类或预测模型知识发现 、数据总结 、数据聚类、关联规则的发现 、时序模型发现、异常和趋势等发现
-
按挖掘对象分类: 包括关系数据库 ,面向对象数据库 ,空间数据库 ,时态数据库 ,文本数据库 ,多媒体数据库 ,异构数据库,数据仓库 ,演绎数据库 ,Web数据等
-
按挖掘方法分类: 包括统计方法,机器学习方法 ,神经网络方法,数据库方法 。统计方法有可以细分为
- 回归分析 (多元回归 , 自回归 )
- 判别分析 (贝叶斯判别 , 费希尔判别,非参数判别 )
- 聚类分析 (系统聚类 , 动态聚类等 )
- 探索性分析 (主成分分析 ,相关分析)
-
机器学习方法 可以细分为:
- 归纳学习 方法 ( 决策数 ,规则归纳 )
- 监督学习
- 无监督学习
-
神经网络方法可以进一步分
- 前向神经网络 (BP 算法等)
- 自组织神经网络 (自组织特征映射 ,竞争学习 )
- 深度神经网络 (卷积神经网络 )
-
数据库方法主要是
- 多维数据分析
- OLAP 技术 等
-
按应用对和领域分类 :
- 流数据挖掘 ,链分析 ,基于Web的广告 ,推荐系统 ,社会网络挖掘
- 流数据挖掘数据来源可以是传感器 ,监控摄像头 ,internet 数据挖掘 ,web 访问等 数据形式是流数据,且到达速度快
- 链分析的起源是防止恶意链接影响搜索引擎对查询结果做出正确判断
- 著名算法是 PageRank 算法
- 流数据挖掘 ,链分析 ,基于Web的广告 ,推荐系统 ,社会网络挖掘
数据挖掘的重要技术 :
关联规则
关联规则反映了一个事物与其他食物之间相互依赖性或则相互关联性 ,如果两个或者多个事物之间存在关联,那么其中一个事物就能从其他已知事物中预测得到
最早出现 挖掘关联规则 算法 是 AIS 和 SETM 等
众多算法最著名的是 R.Agrawal 等人提出 的 Apriori算法
Apriori 算法的核心思想是把发现关联规则的工作 分为了两步
- 第一步 : 交易数据库中求出所有频繁项集,这里频繁项集是指支持度不低于用户设定阈值的项集
- 第二步 : 是用频繁集构造出满足用户最低信任度阈值的规则 ,挖掘所有频繁集是Apriori算法的核心,占整个计算量的大部分 ,后来许多算法对 Apriori 算法进行改进:
如 AprioriTid ,Apriori-Hybrid
决策数
决策树 是一个类似树形结构的流程图 ,每个内部节点表明在一个属性上的测试 ,树枝描述测试结构 ,叶子节点 指明分类或分类的分布情况 ,最顶端的结点是树根
…
标签:02,数据库,神经网络,领域,挖掘,算法,数据挖掘,方法 来源: https://blog.csdn.net/Maker_pace/article/details/120226430
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。