标签:fp bs4 text BeautifulSoup soup print 解析 数据
bs4数据解析原理
- 实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中
- 通过调用BeautifulSoup对象中相关的属性方法进行标签定位和数据提取
如何实例化BeautifulSoup对象:
- from bs4 import BeautifulSoup
- 对象实例化:将本地页面源码加载到BeautifulSoup中:
- fp=open('./test.html','r',encoding='utf-8')
- soup=BeautifulSoup(fp,'lxml')
- 对象实例化:将互联网页面源码加载到BeautifulSoup中:
- page_text=response.text
- soup=BeautifulSoup(page_text,'lxml')
代码示例
from bs4 import BeautifulSoup
fp=open('sougou.html','r',encoding='utf-8')
soup=BeautifulSoup(fp,'lxml')
# print(soup.a) #soup.TagName返回的是html中第一次出现的tagname标签
# print(soup.find('div',class_='single-share')) #属性定位
# print(soup.find_all('div',class_='single-share')) #返回所有
print(soup.select('.single-share>a')[0].text)
标签:fp,bs4,text,BeautifulSoup,soup,print,解析,数据 来源: https://www.cnblogs.com/sjj123/p/15074911.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。