标签:23 Python self url 影评 数据 response 下载
一、说明
数据来源:猫眼;
运行环境:Win10/Python3.7 和 Win7/Python3.5;
分析工具:jieba、WorldCloud、pyecharts和matplotlib;
程序基本思路:分析接口 —> 下载数据 —> 过滤数据 —> 保存文件 —> 统计分析;
注意:本文所有图文和源码仅供学习,请勿他用,转发请注明出处!
参考:https://www.cnblogs.com/reader/p/10070629.html
二、开始
样本数据(23万+):
因为运行的脚本和之前基本差不多,对于数据采集和统计分析的流程直接参考:https://www.cnblogs.com/reader/p/10070629.html
优化下载部分代码,防止因网络原因导致下载失败,导致的程序停止(这里也可以考虑设置重试下载次数):
1 def download(self, url): 2 """下载内容""" 3 self.showstep('Downloading:'+url) 4 5 # 防止网络原因导致下载失败 6 while True: 7 try: 8 response = requests.get(url, headers=self.headers) 9 10 if response.status_code == 200: 11 return response.json() 12 else: 13 self.showstep('Download Fail:' + url) 14 return "" 15 except Exception as e: 16 print(e) 17 time.sleep(3)
三、图形化分析
3.1 观众城市分布热点图
3.2 观众位置分布图
3.3 城市分布人数排行 TOP 20
3.4 词云
标签:23,Python,self,url,影评,数据,response,下载 来源: https://www.cnblogs.com/reader/p/11439879.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。