ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Python网络爬虫笔记12:Scrapy进阶之数据建模与翻页

2021-10-11 14:59:41  阅读:174  来源: 互联网

标签:12 定义 翻页 items 建模 item scrapy 讲师 进阶


1 数据建模

通常在做项目的过程中,在items.py中进行数据建模;如果字段很少时,可以不建模

1.1为什么建模

  1. 定义item即提前规划好哪些字段需要抓,防止手误,因为定义好之后,在运行过程中,系统会自动检查
  2. 配合注释一起可以清晰的知道要抓取哪些字段,没有定义的字段不能抓取,在目标字段少的时候可以使用字典代替
  3. 使用scrapy的一些特定组件需要ltem做支持,如scrapy的ImagesPipeline管道类,百度搜索了解更多

1.2 如何建模

在items.py文件中定义要提取的字段:

class MyspiderIterm(scrapy.Item):
    name = scrapy.Fie1d() # 讲师的名字
    title = scrapy.Field() # 讲师的职称
    desc = scrapy.Field() # 讲师的介绍

1.3 如何使用模板类

模板类定义以后需要在爬虫中导入并且实例化。之后的使用方法和使用字典相同:

 注意:

  1. from myspider.items import Myspiderltem这一行代码中注意item的正确导入路径,忽略pycharm标记的错误<

标签:12,定义,翻页,items,建模,item,scrapy,讲师,进阶
来源: https://blog.csdn.net/m1m2m3mmm/article/details/120700274

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有