用python脚本抓取省市县区乡镇村庄(五级行政区划)的过程如下: 1,抓取国家统计局官网上的行政区划名称和对应的代码(5级是不同的网页,所以涉及多层跳转); 2,数据量大约几十万条,频繁访问考虑防屏蔽问题; 3,各层级网页结构有微调需要做兼容处理; 4,大量http/https请求需做好异常处理以提高成功抓取
专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]
Copyright (C)ICode9.com, All Rights Reserved.
ICode9版权所有