ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

大数据技术【10】

2022-02-09 14:06:57  阅读:103  来源: 互联网

标签:分析 10 结点 预测 HDFS 技术 聚类 数据


1.以下哪些方法可用于预测分析()。

A.指数平滑
B.周期变化分析
C.回归分析
D.其余选项均是

2.以下哪一项不属于Hadoop可以运行的模式()。

A.互联模式
B.分布式模式
C.单机(本地)模式
D.伪分布式模式

3.从经济社会视角来看,大数据的重点在于“数据量大”。

4.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务()。

A.预测建模
B.建模描述
C.寻找模式和规则
D.探索性数据分析

5.监督学习的实例或数据对象有类别标记。

6.传统营销模式比基于大数据的营销模式转化率低。

7.()是在掌握大量观察数据的基础上,利用数理统计方法建立变量与自变量之间的回归关系函数表达式。

A.主成分分析
B.预测分析
C.指数分析
D.回归分析

8.()是目标类数据的一般特性的汇总,通常以用户指定类的数据通过数据库查询收集,其输出可以用多种形式呈现,例如饼图,条形图,折线图等等。

A.数据整合
B.数据属性
C.数据特征
D.数据采集

9.()是一种用作显示一组数据分散情况资料的统计图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

A.直方图
B.雷达图
C.折线图
D.箱形图

10.()是目标类数据的一般特性的汇总,通常以用户指定类的数据通过数据库查询收集,其输出可以用多种形式呈现,例如饼图,条形图,折线图等等。

A.数据采集
B.数据整合
C.数据特征
D.数据属性

11.回归分析分析又称为变异数分析,主要用于两个及两个以上样本均数差别的显著性检验。

12.下面陈述不正确的是()。

A.大数据将实现科学决策
B.大数据将实现预测式决策
C.大数据彻底将群体性事件化解在萌芽状态
D.大数据将实现科学决策

13.将以下大数据的6V特征对应起来

14.以下哪些分类方法可以较好地避免样本的不平衡问题()。

A.SVM
B.KNN
C.神经网络
D.Bayes

15.()是目标类数据的一般特性的汇总,通常以用户指定类的数据通过数据库查询收集,其输出可以用多种形式呈现,例如饼图,条形图,折线图等等。

A.数据整合
B.数据特征
C.数据属性
D.数据采集

16.大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。

17.美国沃尔玛连锁超市的真实案例:尿布与啤酒这两种风马牛不相及的商品居然摆在一起,但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了。这个案例是使用了()的典型例子。

A.云计算
B.物联网
C.聚类
D.关联规则

18.利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性。

19.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()。

A.自然语言处理
B.分类
C.关联规则发现
D.聚类

20.HDFS中的block默认保存()份

A.不确定
B.3
C.1
D.2

21.数据的关联度反映数据的精细化程度,越细化的数据,价值越高。。

22.许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险,这是大数据在()的技术。

A.数据校验
B.知识搜索
C.预测分析
D.数据整合

23.下面()程序负责HDFS数据存储。

A.Jobtracker
B.NameNode
C.Datanode
D.SecondaryNameNode

24.大数据往往是指()及以上级别的数据量。

A.PB
B.MB
C.GB
D.TB

25.大数据通常是指GB级以上的数据。

26.HDFS默认BlockSize的大小是()。

A.64MB
B.32MB
C.128MB
D.256MB

27.数据的不确定性的产生原因不包括()。

A.数据特征描述
B.数据采集与传输
C.数据精度转换
D.缺失值处理

28.()是在已知各种情况发生概率的基础上,通过构成树状结构来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。

A.决策树
B.哈夫曼树
C.文本树
D.生成树

29.2015年8月31日,国务院印发了《促进大数据发展行动纲要》。

30.HDFS中的block默认保存()份

A.2
B.1
C.不确定
D.3

31.()是研究两个或两个以上处于同等地位的随机变量相关性的统计分析方法,包括变量之间是否存在依存关系,存在什么样的依存方向等等。

A.相关分析
B.判别分析
C.回归分析
D.主成分分析

32.BIRCH是一种分类算法。

33.()反映数据的精细化程度,越细化的数据,价值越高。

A.关联度
B.规模
C.活性
D.颗粒度

34.关联规则分析可用于分析顾客消费,以便有针对性的向其推荐感兴趣的服务。

35.下面陈述不正确的是()。

A.大数据将实现科学决策
B.大数据彻底将群体性事件化解在萌芽状态
C.大数据将实现预测式决策
D.大数据将实现科学决策

36.()是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析。

A.数据抽取
B.数据挖掘
C.数据整合
D.数据加载

37.以下哪些分类方法可以较好地避免样本的不平衡问题()。

A.神经网络
B.Bayes
C.KNN
D.SVM

38.下列演示方式中,不属于传统统计图方式的是()。

A.饼状图
B.曲线图
C.网络图
D.柱状图

39.使用大数据可实现预测式决策。

40.将以下大数据的6V特征对应起来

41.KNN算法不仅可以用于分类,还可以用于回归。

42.美国沃尔玛连锁超市的真实案例:尿布与啤酒这两种风马牛不相及的商品居然摆在一起,但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了。这个案例是使用了()的典型例子。

A.关联规则
B.云计算
C.物联网
D.聚类

43.决策树中不包含一下哪种结点()。

A.内部结点
B.叶结点
C.外部结点
D.根结点

44.下面哪一项不属于大数据系统的必备要素()。

A.物联网
B.数据库
C.数据
D.云平台

45.大数据的本质是()。

A.搜集
B.洞察
C.挖掘
D.联系

46.()是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析。

A.数据加载
B.数据抽取
C.数据挖掘
D.数据整合

47.目前所获取的总数据量的80%以上都是()数据。。

A.半结构化
B.非结构化
C.结构化
D.文本

48.在采集数据时要注意用户的隐私安全问题。

49.推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。

A.客户的兴趣爱好
B.客户过去的购买行为和购买记录
C.客户的个人信息
D.客户的朋友

50.以下哪个不属于大数据可视化的应用()。

A.天气云图
B.热点地图
C.响应式表单
D.医学影像

51.聚类与分类的不同在于,聚类所要求划分的类是未知的。

52.()是在掌握大量观察数据的基础上,利用数理统计方法建立变量与自变量之间的回归关系函数表达式。

A.回归分析
B.预测分析
C.主成分分析
D.指数分析

53.聚类是示例式的学习。

54.用户离散的交互痕迹能够为企业提升服务质量提供参考。

55.下面哪一项不属于大数据系统的必备要素()。

A.数据库
B.云平台
C.数据
D.物联网

56.数据再利用可挖掘数据的潜在价值。

57.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()。

A.分类
B.自然语言处理
C.关联规则发现
D.聚类

58.下面()程序负责HDFS数据存储。

A.NameNode
B.Datanode
C.Jobtracker
D.SecondaryNameNode

59.()是数值数据分布的精确图形表示,是一个连续变量(定量变量)的概率分布的估计。它是一种条形图。

A.折线图
B.圆环图
C.直方图
D.散点图

60.2016年,国务院印发《促进大数据发展行动纲要》。

61.分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。

A.时序预测
B.聚类分析
C.关联规则挖掘
D.分类与回归

62.()是一种用作显示一组数据分散情况资料的统计图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

A.雷达图
B.直方图
C.折线图
D.箱形图

63.下列演示方式中,不属于传统统计图方式的是()。

A.网络图
B.曲线图
C.饼状图
D.柱状图

64.决策树中不包含一下哪种结点()。

A.内部结点
B.外部结点
C.叶结点
D.根结点

65.下列演示方式中,不属于传统统计图方式的是()。

A.饼状图
B.柱状图
C.网络图
D.曲线图

66.大数据环境下的隐私担忧,主要表现为()。

A.个人信息的被识别与暴露
B.病毒入侵
C.用户画像的生成
D.恶意广告推送

67.目前所获取的总数据量的80%以上都是()数据。。

A.文本
B.结构化
C.非结构化
D.半结构化

68.下面哪一项不属于大数据系统的必备要素()。

A.数据库
B.数据
C.云平台
D.物联网

69.()反映数据的精细化程度,越细化的数据,价值越高。

A.规模
B.关联度
C.颗粒度
D.活性

70.以下哪些算法是分类算法()。

A.C4.5
B.EM
C.K-Means
D.DBSCAN

71.预测建模任务主要包括哪几大类问题?

A.分类和回归
B.分类和模式匹配
C.分类和模式发现
D.模式发现和模式匹配

72.大数据可视化可以用在以下何种场景()。

A.公司财务报表、销售统计
B.其余所有选项均可
C.电子地图
D.股票趋势

73.()表示数据分布的集中位置,如Mean:平均数、Median:中位数、Mode:众数等。

A.数据属性
B.数据分布形状
C.集中趋势度量
D.离中趋势度

74.协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(),并将这些用户喜欢的项推荐给有相似兴趣的用户。

A.预测
B.相似
C.相同
D.推荐

75.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?

A.根据内容检索
B.建模描述
C.预测建模
D.寻找模式和规则

76.以下哪个不属于大数据的关键技术()。

A.可视化
B.流处理
C.数据表
D.并行化

77.()是在已知各种情况发生概率的基础上,通过构成树状结构来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。

A.生成树
B.决策树
C.哈夫曼树
D.文本树

78.聚类分析所使用方法的不同也会得到相同的结论。

79.以下哪个选项是目前利用大数据分析技术无法进行有效支持的()。

A.精确预测股票价格
B.新型病毒的分析判断
C.天气情况预测
D.个人消费习惯分析及预测

80.()是一种用作显示一组数据分散情况资料的统计图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

A.雷达图
B.直方图
C.箱形图
D.折线图

81.可视化是大数据分析的根本目的。

82.以下哪个不属于大数据的技术特征()。

A.力求数据的精确性
B.重视数据的复杂性
C.关注数据的相关性
D.分析全面的数据

83.以下哪个不属于分类算法()。

A.KNN算法
B.决策树
C.朴素贝叶斯
D.K均值算法

84.噪声数据处理的主要方法不包括()。

A.分箱
B.关联分析
C.聚类
D.回归

85.以下哪些算法是分类算法()。

A.K-Means
B.C4.5
C.DBSCAN
D.EM

86.大数据技术可应用于金融、互联网、公共管理等不同的领域。

87.下面陈述不正确的是()。

A.大数据将实现科学决策
B.大数据彻底将群体性事件化解在萌芽状态
C.大数据将实现科学决策
D.大数据将实现预测式决策

88.大数据的特征不包含()。

A.高速性
B.多样性
C.规模性
D.价值密度高

89.以下哪项不属于数据挖掘的内容()。

A.多维分析统计用户出行规律
B.高德地图导航躲避拥堵的功能
C.建立道路拥堵概率与拥堵趋势变化模型
D.补充与完善路网属性

90.聚类分析可以看作是一种非监督的分类。

91.大数据的()指数据能够被组织并呈现。借助于图形化手段,清晰有效地传达和沟通信息。基于数据,借助可视化手段提高大脑利用率。

A.多样性
B.大量性
C.可视化
D.低价值密度

92.下面()程序负责HDFS数据存储。

A.Jobtracker
B.SecondaryNameNode
C.NameNode
D.Datanode

93.Hadoop框架中最核心的设计是()。

A.ZooKeeper和HDFS
B.Hive和HDFS
C.MapReduce和Hive
D.MapReduce和HDFS

94.以下哪些算法是分类算法()。

A.K-Means
B.EM
C.C4.5
D.DBSCAN

95.以下哪些方法可用于预测分析()。

A.周期变化分析
B.其余选项均是
C.指数平滑
D.回归分析

96.中国大数据产业特征不包括()。

A.互联网企业表现强势
B.大数据整体解决方案已成熟
C.大数据基础研究受到重视
D.区域产业集聚现雏形

97.从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

98.以下哪个不属于大数据技术的特征()。

A.随机抽样
B.全面分析数据
C.关注数据的相关性
D.重视数据的复杂性

99.()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

A.回归分析
B.主成分分析
C.预测分析
D.指数分析

100.()是目标类数据的一般特性的汇总,通常以用户指定类的数据通过数据库查询收集,其输出可以用多种形式呈现,例如饼图,条形图,折线图等等。

A.数据属性
B.数据整合
C.数据采集
D.数据特征

标签:分析,10,结点,预测,HDFS,技术,聚类,数据
来源: https://blog.csdn.net/robin9409/article/details/122840478

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有