标签:编码 网页 encoding bs4 text url 应用 requests
1.requests模块:
1.1)它是python中基于网络请求的模块,功能很强大,简单便捷,效率高。
2.如何使用:(requests模块的编码流程)
2.1.导入requests库 |
2.2.指定url |
2.3.发起请求 |
2.4.获取响应数据 |
2.5.数据保存 |
网页数据爬取
3.requests库:
3.1)方法:
r=requests.get('url'):发送请求获取资源对象,并且返回资源对象
requests.request(代码标签):构造请求
requests.head():获取网页头信息
3.2)步骤:
import requests:导入库
r=requests.get('url'):发送并返回请求资源对象
print(r.status_code):查看状态码
r.encoding:查看网页编码
r.apparent_encoding:根据网页内容评估的备用编码
r.text:查看整个网页的内容
r.encoding=r.apparent_encoding:将备用编码替换头编码
r.text[-500:]
r.text[:1000]
数据的优化
from bs4 import BeautifuSoup
soup=BeautifulSoup(文本/网页内容,'html.parser')
print(soup.prettify)
图片数据爬取
标签:编码,网页,encoding,bs4,text,url,应用,requests 来源: https://blog.csdn.net/ouyangxikun/article/details/122147420
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。