爬虫

练习爬虫，我想问一下这个xpath语句为啥找不到元素，感谢大佬！2022-09-14 14:00:09

大家好，我是皮皮。一、前言前几天在Python钻石交流群【萤火】问了一个Python网络爬虫的问题，下图是截图：下图是报错截图：二、实现过程这里【error】给了一个代码，如下所示，满足粉丝的需求：用selenium没找到的话，大概率是网页还没渲染出来，代码就运行到了抓取规则，所以抓不到。其实
盘点一个Python网络爬虫过程中中文乱码的问题2022-09-13 14:30:42

大家好，我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫中文乱码的问题，提问截图如下：原始代码如下： import requests import parsel url='https://news.p2peye.com/article-514723-1.html' headers={ 'Accept-Language': 'zh-CN,zh;q=0.9', 'Accept'
爬虫042022-09-12 19:33:09

python中的re模块 findall import re # findall: 匹配字符串中所有符合正则的内容前面pattern是正则表达式后面string是字符串 lst = re.findall(r"\d+", "花花的电话是125486，春卷的电话是885234") # r放前面是防止转义 print(lst) # ['125486', '885234'] finditer # find
requests 爬虫基础2022-09-09 20:33:44

import requests #导入 requests 包先看请求的方法是什么，比如 get，proct然后有些内容是通过异步加载的，所有我们要找到异步加载的文件，异步加载：执行过程同时加载查找的方法是，检查，找到网络，点XHR 就可以看到异步数据，，请求标头有 X-Requested-With: XMLHttpRequest，要用post的里面的
爬虫网易课堂2022-09-09 20:32:03

import requests herd={ 'accept': 'application/json', 'accept-encoding': 'gzip, deflate, br', 'User-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
Python 爬虫工程师需要掌握哪些技术？2022-09-09 16:30:25

Python爬虫工程师需要掌握哪些技术？一、爬虫工程师是干嘛的？ 1、主要工作内容？互联网是由一个一个的超链接组成的，从一个网页的链接可以跳到另一个网页，在新的网页里，又有很多链接。理论上讲，从任何一个网页开始，不断点开链接、链接的网页的链接，就可以走遍整个互联网！这个过程是不是
爬虫技术-验证码处理2022-09-09 09:01:46

验证码反爬虫 1. 简介我们在浏览网站的时候经常会遇到各种各样的验证码，在多数情况下这些验证码会出现在登录账号的时候，也可能会出现在访问页面的过程中，严格来说，这些行为都算验证码反爬虫。样例：https://my.cnki.net/Register/CommonRegister.aspx?returnUrl=https://www.cnki
爬虫数据可视化前的环境准备(已安装python环境前提下)2022-09-08 20:33:54

一、requests请求库安装在桌面右键打开终端输入：pip install requests 二、Beautiful Soup解析库安装终端输入： Beautiful Soup 4安装：pip install bs4 lxml安装：pip install lxml 三、matplotlib安装下载miniconda 下载地址：https://docs.conda.io/en/latest/miniconda.html w
爬虫技术-cookie反爬讲解2022-09-04 17:30:18

COOkIE反爬虫 1 cookie反爬简介 Cookie 反爬虫指的是服务器端通过校验请求头中的 Cookie 值来区分正常用户和爬虫程序的手段，这种手段被广泛应用在 Web 应用中。 1.1 cookie加密原理 2 cookie逆向实践 2.1 逆向目标地址：http://www.zjmazhang.gov.cn/hdjlpt/published?via=pc
Python爬虫-Pyquery的用法（四）2022-09-03 18:02:52

一、 PyQuery介绍与安装 1、PyQuery简介 PyQuery简介 PyQuery库也是一个非常强大又灵活的网页解析库，如果你有前端开发经验的，都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择。官网地址：http://pyquery.readthedocs.io/en/latest/ jQuery参考文档：可以用来查找选择器 2、
网页爬虫2022-09-03 04:30:08

记录一下如何抓一个网页：做开发的经常会被问到怎么去抓别人的数据那么抓数据可以分成抓接口数据或网页数据其实都是网络上的内容，有各自的特点抓接口数据一般通过第三方软件代理http来看到请求实体而抓网页内容通常我们会叫它爬虫… 那么爬虫是怎么回事呢？抓取网页有效内容并
05.爬虫入门笔记12022-08-26 01:30:49

入门爬虫笔记01 1.request库的使用使用request库的get方法 import request r = request.get('www.baidu.com') 这会得到一个Response对象，将其存入变量r。显示得到的html代码 print（r.text）有时候会出现乱码的情况，这时候在网站使用开发者工具(F12)，在head标签下，找一下'charse
python爬虫之BeautifulSoup4使用2022-08-22 18:01:29

钢铁知识库，一个学习python爬虫、数据分析的知识库。人生苦短，快用python。上一章我们讲解针对结构化的html、xml数据，使用Xpath实现网页内容爬取。本章我们再来聊另一个高效的神器：Beautiful Soup4。相比于传统正则表达方式去解析网页源代码，这个就简单得多，实践是检验真理的唯一标准，
小红书数据小红书爬虫小红书接口 xhs2022-08-22 09:36:22

小红书数据小红书接口小红书api（小红书爬虫 xhs xiaohongshu 红书）最新小红书APP接口稳定运行,主流接口都已部署，支持并发请求！只抓取公开数据供作学习用途，不做引流上赞上粉业务，如有侵权，联系删除，谢谢！只提供数据支持，不交流方案！联系加q 2126851589！ Github地址：https://github.com/s
一个远大的目标2022-08-20 21:30:09

1. python基础 c语言计算机网络基础计算机组成原理编译原理算法和数据结构 2. web漏洞精通爬虫精通 ctf比赛渗透测试成熟 3.你说培训机构的人，那他妈的也不行啊，牛逼的人早被安全公司拉拢了。
爬虫-获取豆瓣Top250信息2022-08-19 23:33:12

import time import requests from lxml import etree i = 0 for item in range(0, 275, 25): url = f'https://movie.douban.com/top250?start={item}&filter=' headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win
PHP爬虫（2）DOM处理2022-08-19 22:33:53

https://www.cnblogs.com/jbexploit/p/4592527.html 摘要：在PHP爬虫（1）中详细了介绍了CURL抓取HTML数据的技术。采集数据处理也是爬虫技术中非常重要的部分。处理HTML数据可以用字符串查找，也可以利用正则表达式，但采用Dom处理是最高级的方法。现在我们要抓取中国军网首页“军媒要闻
学习：python 小试验 ruquest爬虫爬取音乐2022-08-19 01:03:03

控制台抓包获取音乐链接不多说了最后成功下载到本地
python爬虫实例: 对指定城市kfc餐厅信息的爬取2022-08-18 22:00:56

python爬虫实例: 对指定城市kfc餐厅信息的爬取要求：爬取指定 kfc 餐厅数据 kfc餐厅查询的url：http://www.kfc.com.cn/kfccda/storelist/index.aspx 分析: 由于餐厅信息是Ajax请求的动态数据，所以从原url爬取的数据是不会有想要城市的kfc餐厅的信息解决方法：找到真正发送请求的对
【C# - 爬虫】使用Selenium实现爬虫，获取近七天天气信息（包含完整代码）2022-08-18 21:05:05

目录前言一、Selenium简介二、浏览器驱动1.浏览器驱动参考2.Windows下载Chrome驱动三、代码实现1.新建控制台项目WeatherWebCrawler2.选择.NET 6.03.安装NuGet包4.将下载好的驱动放到项目生成目录下5.编写代码四、完整代码总结前言提示：爬虫本身并不违法，所有爬虫都
搭建爬虫2022-08-18 16:32:11

爬虫学习起来并不难，网上有很多这块的教程；但如果需要深入学习一些复杂的爬虫，就得搞懂一些算法，不断优化后，就可以编写一个牛逼的爬虫了。掌握基本的爬虫工作原理之后，先学习下Scrapy，然后是Bloom Filter: https://llimllib.github.io/bloomfilter-tutorial/。如果需要大规模网页
M3U8流视频数据爬虫2022-08-17 16:32:41

M3U8流视频数据爬虫 HLS技术介绍现在大部分视频客户端都采用HTTP Live Streaming，而不是直接播放MP4等视频文件（HLS，Apple为了提高流播效率开发的技术）。HLS技术的特点是将流媒体切分为若干【TS片段】（比如几秒一段），然后通过一个【M3U8列表文件】将这些TS片段批量下载供客户端播放器实
关于运行SCRAPY项目时提示 MODULENOTFOUNDERROR: NO MODULE NAMED的解决2022-08-17 16:30:51

from scrapydemo.scrapydemo.items import ScrapydemoItem 以上是pycharm自动填充的，相对路径没有问题，是从项目根目录开始的，然鹅，执行项目就报错------>ModuleNotFoundError: No module named 'scrapy项目名.scrapy项目名' 看了好多博客都说是因为scrapy项目名和爬虫文件名相同导致
Python逆向爬虫之pyquery，非常详细2022-08-17 14:02:18

系列目录 Python逆向爬虫之pyquery pyquery是一个类似jquery的python库，它实现能够在xml文档中进行jQuery查询，pyquery使用lxml解析器进行快速在xml和html文档上操作，它提供了和jQuery类似的语法来解析HTML文档，支持CSS选择器，使用非常方便。一、pyquery安装 pip install pyquery 二
非常全的一份Python爬虫的Xpath博文2022-08-17 13:02:07

非常全的一份Python爬虫的Xpath博文 Xpath 是 python 爬虫过程中非常重要的一个用来定位的一种语法。一、开始使用首先我们需要得到一个 HTML 源代码，用来模拟爬取网页中的源代码。首先我们需要下载一下 lxml 包。 pip install lxml 准备一个HTML源代码。 from lxml import etr

首页 < 1 2 3 4 5 6 7 8 > 尾页

ICode9

练习爬虫，我想问一下这个xpath语句为啥找不到元素，感谢大佬！2022-09-14 14:00:09

盘点一个Python网络爬虫过程中中文乱码的问题2022-09-13 14:30:42

爬虫042022-09-12 19:33:09

requests 爬虫基础2022-09-09 20:33:44

爬虫网易课堂2022-09-09 20:32:03

Python 爬虫工程师需要掌握哪些技术？2022-09-09 16:30:25

爬虫技术-验证码处理2022-09-09 09:01:46

爬虫数据可视化前的环境准备(已安装python环境前提下)2022-09-08 20:33:54

爬虫技术-cookie反爬讲解2022-09-04 17:30:18

Python爬虫-Pyquery的用法（四）2022-09-03 18:02:52

网页爬虫2022-09-03 04:30:08

05.爬虫入门笔记12022-08-26 01:30:49

python爬虫之BeautifulSoup4使用2022-08-22 18:01:29

小红书数据 小红书爬虫 小红书接口 xhs2022-08-22 09:36:22

一个远大的目标2022-08-20 21:30:09

爬虫-获取豆瓣Top250信息2022-08-19 23:33:12

PHP爬虫（2）DOM处理2022-08-19 22:33:53

学习：python 小试验 ruquest爬虫 爬取音乐2022-08-19 01:03:03

python爬虫实例: 对指定城市kfc餐厅信息的爬取2022-08-18 22:00:56

【C# - 爬虫】使用Selenium实现爬虫，获取近七天天气信息（包含完整代码）2022-08-18 21:05:05

搭建爬虫2022-08-18 16:32:11

M3U8流视频数据爬虫2022-08-17 16:32:41

关于运行SCRAPY项目时提示 MODULENOTFOUNDERROR: NO MODULE NAMED的解决2022-08-17 16:30:51

Python逆向爬虫之pyquery，非常详细2022-08-17 14:02:18

非常全的一份Python爬虫的Xpath博文2022-08-17 13:02:07

小红书数据小红书爬虫小红书接口 xhs2022-08-22 09:36:22

学习：python 小试验 ruquest爬虫爬取音乐2022-08-19 01:03:03