标签:XPath 数据项 网页 Excel 抓取 网址 京东 数据
上期我们使用抓取公式抓取了船舶状态,有好多小伙伴便问能不能用这个公式抓取京东商品的一些信息到Excel表格中呢?今天小编就给大家演示一下,做电商的朋友要注意了!
首先给大家看一下我们今天要抓取的数据有哪些,如下图
下面是抓取的结果:
接下来,小编给您介绍完整的抓取步骤:
第一步:安装Excel网络函数库。本案例所涉及的公式都是免费的,使用也没有任何限制。
函数库的网址: www.excelapi.com
第二步:构造网址。以抓取京东手机数据为例,我们在京东官网上输入手机查询的时候,很容易从浏览器地址栏获得查询网址,简单分析,可以找到网址拼接规律,只要将手机订单编号拼接到网址后就行。
第三步:分析网页结构。找到数据项所在XPath。推荐使用Chrome浏览器,打开要采集的网页,如下图所示,我们要找到手机信息所在网页元素的XPath。
将光标移到船舶状态上,右键,在弹出菜单中选择检查,在弹出的开发者工具窗体中,找到要抓取的数据项,右键,选择Copy,选择Copy XPath获得如下XPath。每一个数据项都这样去处理。
第四步:写公式GetWebContentByXPathW( url, xpath)。url参数传入拼接的网址,xpath用找到数据项。如下图所示:
第五步:运行Excel浏览器,设置网页抓取任务。
第六步:当Excel浏览器全部抓取完毕后,回到Excel表格重新计算公式。具体流程如下:
标签:XPath,数据项,网页,Excel,抓取,网址,京东,数据 来源: https://www.cnblogs.com/wlhsk/p/16496890.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。