首页 > 其他分享> 文章详细

爬取小说龙族5

2022-02-03 18:31:07 阅读：298 来源： 互联网

标签：龙族 soup url list li 爬取 headers new 小说

"""

姓名：赵康乐

职业：学生

任务：爬取小说龙族5并保存

日期：2022-2-3

"""

import requests
from bs4 import BeautifulSoup

url = "https://www.75xs.cc/book/longzuV/"
headers = {
    "User-Agent":
        "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:96.0) Gecko/20100101 Firefox/96.0"
}
response = requests.get(url=url, headers=headers).text.encode("iso-8859-1")
# print(response)
soup = BeautifulSoup(response, "lxml")
list = soup.find("div", class_="m-book-list")
# print(list)
lis = list.find_all("li", class_="line3")
for li in lis:
    title = li.a.text
    new_url = "https://www.75xs.cc" + li.a["href"]
    resp = requests.get(new_url,headers=headers).text.encode("iso-8859-1")
    new_soup = BeautifulSoup(resp,"lxml")
    con = new_soup.find("div",class_="content")
    content = con.text
    with open("D:\桌面\龙族5.txt",mode="a",encoding="utf-8") as fp:
        fp.write(title)
        fp.write(content)
    print(title+"下载完成")

标签：龙族,soup,url,list,li,爬取,headers,new,小说
来源： https://www.cnblogs.com/zhaokangle/p/15861816.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

爬取小说龙族5