标签:title 无标题 selector headers lis print li
当当网的书籍信息
# 发送请求
import requests
# 确定 url 地址
url = 'http://book.dangdang.com/?_utm_brand_id=11106&_ddclickunion=460-5-biaoti|ad_type=0|sys_id=1'
# 添加请求头 headers(User—Agent)
headers = {
'User—Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36'
}
# 发送请求,获取数据
response = requests.get(url,headers)
# <Response [200]> 状态码,请求成功
#print(response.text)#字符串
#解析数据
#数据解析模块
import parsel
selector = parsel.Selector(response.text)#转换成 selector 对象
#css 选择器,根据标签属性,右键 copy
lis = selector.css('#component_403754__5298_5294__5294 > li')
#print(lis)
for li in lis:
title = li.css('.name a::attr(title)').get()
print(title)
价格那一栏是整数和小数分开的,把字符串合并一下。
标签:title,无标题,selector,headers,lis,print,li 来源: https://blog.csdn.net/qq_44846756/article/details/122491537
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。