标签:Beautiful string soup 标签 元素 Soup tag print type
+-----------------------------------------+---------------------------------------------------------------------------------------------------------
| Tag + 标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾 |
| Name + 标签的名字,<P>...........</p>的名字是‘p’, 格式:<tag>.name |
| Attributes + 标签的属性,字典形式组织,格式:,<tag>.attrs |
| NavigableString + 标签内非属性字符串,<>......</>中字符串,格式:<tag>.string |
| Comment + 标签内字符串的注释部分,一种特殊的Comment类型 |
+-----------------------------------------+---------------------------------------------------------------------------------------------------------
from bs4 import BeautifulSoup import requests r = requests.get('https://python123.io/ws/demo.html') demo = r.text soup = BeautifulSoup(demo,'html.parser') print(soup.title) tag = soup.a print(tag) #获取标签的名字 name print(soup.a.parent.parent.name) #标签的属性信息 attrs print(tag.attrs['class']) print(tag.attrs['href']) print(type(tag)) #获取标签内的字符串 print(soup.p) print(soup.p.string) print(type(soup.p.string)) # 对html注释的处理,当打印type时结果为comment时为有字符串 newsoup = BeautifulSoup("<b><!--This is a comment--></b><p>This is not a comment<p>" ,'html.parser') print(newsoup.b.string) print(type(newsoup.b.string)) print(type(newsoup.p.string))
标签:Beautiful,string,soup,标签,元素,Soup,tag,print,type 来源: https://www.cnblogs.com/nannong923484082/p/11890612.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。