ICode9

精准搜索请尝试: 精确搜索
  • 08 学生课程分数的Spark SQL分析2021-05-19 22:32:36

    1.用DataFrame的操作或SQL语句完成以下数据分析要求:    2.总共有多少学生? 3.开设了多少门课程?    4.每个学生选修了多少门课?    5.每门课程有多少个学生选?    6.Tom选修了几门课?每门课多少分?    7.Tom的成绩按分数大小排序。    8.Tom的平均分。    9.每个

  • 08 学生课程分数的Spark SQL分析2021-05-19 12:05:08

    读学生课程分数文件chapter4-data01.txt,创建DataFrame: 用DataFrame的操作或SQL语句完成以下数据分析要求,并和用RDD操作的实现进行对比: 1.每个分数+5分。 2.总共有多少学生? 3.总共开设了哪些课程? 4.每个学生选修了多少门课? 5.每门课程有多少个学生选? 6.每门课程大于95分的学

  • 08 学生课程分数的Spark SQL分析2021-05-18 18:04:55

    读学生课程分数文件chapter4-data01.txt,创建DataFrame。 url = "file:///usr/local/spark/mycode/rdd/chapter4-data01.txt" rdd = spark.sparkContext.textFile(url).map(lambda line:line.split(',')) rdd.take(3) from pyspark.sql.types import IntegerType,Str

  • 学生课程分数的Spark SQL分析2021-05-17 21:03:17

    读学生课程分数文件chapter4-data01.txt,创建DataFrame。 url = "file:///D:/chapter4-data01.txt" rdd = spark.sparkContext.textFile(url).map(lambda line:line.split(',')) rdd.take(3) from pyspark.sql.types import IntegerType,StringType,StructField,Str

  • 08 学生课程分数的Spark SQL分析2021-05-17 20:33:22

    读学生课程分数文件chapter4-data01.txt,创建DataFrame。 1.用DataFrame的操作或SQL语句完成以下数据分析要求: 2.总共有多少学生? 3.开设了多少门课程? 4.每个学生选修了多少门课? 5.每门课程有多少个学生选? 6.Tom选修了几门课?每门课多少分? 7.Tom的成绩按分数大小排序。 8.Tom

  • 06 RDD编程2021-04-23 21:33:53

    06 RDD编程   学生课程分数案例 总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map(), countByKey() 每门课程有多少个学生选?map(), countByValue() Tom选修了几门课?每门课多少分?filter(), map()  Tom选修了几门课?每门课多少分?map(),

  • 05 RDD编程2021-04-22 20:02:29

    一、词频统计: 读文本文件生成RDD lines 将一行一行的文本分割成单词 words flatmap() 全部转换为小写 lower() 去掉长度小于3的单词 filter() 去掉停用词 转换成键值对 map() 统计词频 reduceByKey() 按字母顺序排序 按词频排序  10、结果文件保存 sa

  • 5.RDD2021-04-19 14:02:23

    总共有多少学生?map(), distinct(), count()    .开设了多少门课程?    每个学生选修了多少门课?map(), countByKey()    每门课程有多少个学生选?map(), countByValue()    Tom选修了几门课?每门课多少分?filter(), map() RDD    Tom的成绩按分数大小排序。filter(),

  • 05 RDD编程2021-04-19 13:32:35

    一、词频统计: 读文本文件生成RDD lines 将一行一行的文本分割成单词 words flatmap() 全部转换为小写 lower() 去掉长度小于3的单词 filter()去掉停用词       转换成键值对 map() 统计词频 reduceByKey() 按字母顺序排序 sortBy(f) 按词频排序 sortByKey()     结果

  • 06 RDD编程2021-04-19 12:35:58

    总共有多少学生?map(), distinct(), count() 开设了多少门课程?     每个学生选修了多少门课?map().countByValue()           //map(), countByKey()     每门课程有多少个学生选?map(), countByValue()     Tom选修了几门课?每门课多少分?filter(), map() RDD

  • 05 RDD编程2021-04-19 12:34:28

    按字母顺序排序 sortBy(f)   按词频排序 sortByKey() 二、学生课程分数案例 总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map().countByValue()           //map(), countByKey() 每门课程有多少个学生选?map(), countByValue

  • 05 RDD编程2021-04-19 09:05:30

    一、词频统计: 读文本文件生成RDD lines 将一行一行的文本分割成单词 words flatmap() 全部转换为小写 lower() 去掉长度小于3的单词 filter() 去掉停用词 转换成键值对 map() 统计词频 reduceByKey() 按字母顺序排序 sortBy(f) 按词频排序 sortByKey()

  • 05 RDD编程2021-04-18 22:02:18

    05 RDD编程 一、词频统计 1.读文本文件生成RDD lines   2.将一行一行的文本分割成单词 words flatmap()   3.全部转换为小写 lower()   4.去掉长度小于3的单词 filter()   5.去掉停用词   6.转换成键值对 map() 7.统计词频 reduceByKey()   8.按字母顺序排序 sortBy(f)

  • 05 RDD编程2021-04-18 20:33:55

    按字母顺序排序 sortBy(f)     按词频排序 sortByKey() 总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map(), countByKey() 每门课程有多少个学生选?map(), countByValue() Tom选修了几门课?每门课多少分?filter(), map() RDD Tom

  • RDD编程2021-04-18 18:03:52

    一、词频统计: 1.读文本文件生成RDD lines     2.将一行一行的文本分割成单词 words flatmap()     3.全部转换为小写 lower()     4.去掉长度小于3的单词 filter()     5.去掉停用词   6.转换成键值对 map()   7.统计词频 reduceByKey()   8.按字母顺序排序 sor

  • RDD编程2021-04-18 17:35:03

    1.读文本文件生成RDD lines   2.将一行一行的文本分割成单词 words flatmap()   3.全部转换为小写 lower()   4.去掉长度小于3的单词 filter()   5.去掉停用词   6.转换成键值对 map() 7.统计词频 reduceByKey()   8.按字母顺序排序 sortBy(f)   9.按词频排序 sortB

  • 05 RDD编程2021-04-18 16:36:17

    一、词频统计: 1.读文本文件生成RDD lines     2.将一行一行的文本分割成单词 words flatmap()     3.全部转换为小写 lower()     4.去掉长度小于3的单词 filter()     5.去掉停用词     6.转换成键值对 map()     7.统计词频 reduceByKey()     8.按字母顺

  • 05 RDD编程2021-04-17 23:35:27

    一、词频统计 1.读文本文件生成RDD lines   2.将一行一行的文本分割成单词 words flatmap()   3.全部转换为小写 lower()   4.去掉长度小于3的单词 filter()   5.去掉停用词   6.转换成键值对 map() 7.统计词频 reduceByKey()   8.按字母顺序排序 sortBy(f)   9.按词

  • RDD编程2021-04-16 17:33:17

    总共有多少学生?map(), distinct(), count() 开设了多少门课程?     每个学生选修了多少门课?map().countByValue()           //map(), countByKey()     每门课程有多少个学生选?map(), countByValue()     Tom选修了几门课?每门课多少分?filter(), map() RDD

  • 06 RDD编程2021-04-16 17:32:27

    二、学生课程分数案例    1.总共有多少学生?map(), distinct(), count()    2.开设了多少门课程?    3.每个学生选修了多少门课?map(), countByKey()    4.每门课程有多少个学生选?map(), countByValue()    5.Tom选修了几门课?每门课多少分?filter(), map() RDD  

  • RDD编程2021-04-12 22:02:01

    二、学生课程分数案例 总共有多少学生?map(), distinct(), count()     开设了多少门课程?     每个学生选修了多少门课?map(), countByKey()     每门课程有多少个学生选?map(), countByValue()     Tom选修了几门课?每门课多少分?filter(), map() RDD     Tom

  • 062021-04-12 21:09:30

    二、学生课程分数案例 总共有多少学生?map(), distinct(), count()     开设了多少门课程? 每个学生选修了多少门课?map().countByValue()           //map(), countByKey()     每门课程有多少个学生选?map(), countByValue()     Tom选修了几门课?每门课多少分?f

  • 06 RDD编程2021-04-12 21:09:07

    二、学生课程分数案例 总共有多少学生?map(), distinct(), count()     开设了多少门课程?     每个学生选修了多少门课?map(), countByKey()     每门课程有多少个学生选?map(), countByValue()     Tom选修了几门课?每门课多少分?filter(), map() RDD     Tom

  • 06 RDD编程2021-04-12 19:36:31

    二、学生课程分数案例 总共有多少学生?map(), distinct(), count() 开设了多少门课程?    每个学生选修了多少门课?map().countByValue()  每门课程有多少个学生选?map(), countByValue()     Tom选修了几门课?每门课多少分?filter(), map() RDD Tom选修了几门课?

  • 06 RDD编程2021-04-12 19:36:24

    二、学生课程分数案例 总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map(), countByKey() 每门课程有多少个学生选?map(), countByValue() Tom选修了几门课?每门课多少分?filter(), map() RDD Tom选修了几门课?每门课多少分?map(),lookup

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有