标签:word Python items 练习 spark Spark counts
一、安装Spark
- 检查基础环境hadoop,jdk
2.下载spark
3.配置文件
配置环境 vim /usr/local/spark/conf/spark-env.sh
二、Python编程练习:英文文本的词频统计
1.准备文本文件
2.统计每个单词出现的次数
counts = {}
for word in afterwords:
counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
i=1
while i<=len(items):
word,count = items[i-1]
print("{0:<20}{1}".format(word,count))
i=i+1
3.结果写文件
标签:word,Python,items,练习,spark,Spark,counts 来源: https://www.cnblogs.com/ysyblog/p/15982358.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。