ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Beautiful用法总结

2019-04-24 19:53:23  阅读:606  来源: 互联网

标签:Beautiful 总结 标签 用法 获取 查找 解析 节点 属性


一、安装 通过命令:pip3 install Beautifulsoup4; 安装后运行:from bs4 import BeautifulSoup,没有报错,说明安装正常; 二、解析库 Beautifulsoup有四种解析方法: 1、BeautifulSoup(markup,"html.parser") 解析速度适中,文档容错能力强 2、BeautifulSoup(markup,"lxml") 解析速度快,文档容错能力强,但是需要安装C语言库 3、BeautifulSoup(markup,"xml") 解析速度快,唯一支持XML的解析器,但是需要安装C语言库 4、BeautifulSoup(markup,"html5lib") 最好的容错性,以浏览的方式解析文档,生成HTML5格式的文档,但是解析速度慢 三、基本使用 使用type查看获取tag的类型发现,每个标签的类型都是<class 'bs4.element.Tag'>,也就是说通过soup.title这样的形式获取的类型都是Tag类型; 四、常用标签选择器 1、选择元素:与HTML中的标签一样,直接获取对应名称; 2、获取名称:通过name属性,可以直接获取到标签的名称; 3、获取属性:通过attrs属性获取属性值,或者直接获取属性值; 4、获取内容 5、嵌套选择 6、子节点:代码中存在层级结构 contents属性:返回形式是列表形式; children属性:返回形式是列表类型,需要通过迭代的方式将里面数据取出(使用enumerate属性); descendants属性:返回形式也是列表类型,但是会将标签页下面的所有节点返回(使用enumerate属性); 7、父节点:父节点类型是Tag类型; 8、兄弟节点: next_siblings:获取下面的兄弟节点; previous_siblings:获取前面的兄弟节点; 五、文档树搜索 1、find_all(name, attrs, recursive, text, **kwargs):根据标签名,属性,内容进行查找,返回所有元素; name:根据标签名查找标签,返回查找的所有元素 attrs:根据属性名进行查找,返回所有元素(注:使用class进行查找元素,因为class在Python中相当于一个关键字,不能当做参数进行使用,需要使用class_当做参数进行使用) text:根据内容进行查找,返回所有元素 2、find(name, attrs, recursive, text, **kwargs):根据标签名,属性,内容进行查找,返回单个元素; 六、CSS选择器 通过select()直接传入CSS参数即可; 1、获取属性: 2、获取内容:

 

 

标签:Beautiful,总结,标签,用法,获取,查找,解析,节点,属性
来源: https://www.cnblogs.com/kongjiangbing/p/10764510.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有