首页 > 其他分享> 文章详细

bs4解析

2021-08-02 23:02:15 阅读：216 来源： 互联网

标签：bs4 标签 BeautifulSoup soup tagName text 解析 find

数据解析的原理：

标签定位
提取标签、标签属性中存储的数据值

bs4数据解析的原理：

实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中
通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取

如何实例化BeautifulSoup对象:

from bs4 import BeautifulSoup
对象的实例化：
- 将本地的HTML文档中的数据加载到该对象中
- 将互联网上获取的页面源码加载到该对象中
提供的用于数据解析的方法和属性：
- soup.tagName:返回的是文档中第一次出现的tagName对应的标签
- soup.find():
  - find(‘tagName’):等同于soup.tagName
  - 属性定位：find(‘tagName’,class_/id/attr=’’)
- soup.find_all(‘tagName’)：返回符合要求的所有标签（列表）
- select：
  - select(‘某种选择器（id、class、标签……）’)，返回的是一个列表
  - 层级选择器：
    - 表示的是一个层级
    - 空格表示的是多个层级
获取标签之间的文本数据：soup.tagName.text/string/get_text()
- text/get_text():可以获取某一个标签中所有的文本内容
- string:只可以获取该标签下直系的文本内容
获取标签中属性值：soup.tagName[‘属性’]

标签：bs4,标签,BeautifulSoup,soup,tagName,text,解析,find
来源： https://blog.csdn.net/ouat2018/article/details/119334949

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

bs4解析