ICode9

精准搜索请尝试: 精确搜索
  • 微博 新老入口2020-01-13 19:00:40

    https://weibo.com  https://weibo.cn   https://s.weibo.com  https://weibo.cn/search/mblog?advanced=mblog&f=s   微博抓取经验总结 微博不封IP,只封账号  对于weibo.cn和weibo.com这两个站点的cookie是不同的,所以要构建两个账号池,一个cn站点的,一个com站点的。 总结

  • 【Python】selenium模拟淘宝登录2019-12-09 09:00:44

    # -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC impor

  • Python 分析到底是谁操纵《庆余年》上了热搜?2019-12-07 16:52:49

      庆余年电视剧终于在前两天上了,这两天赶紧爬取数据看一下它的表现。 ​   ​ 庆余年   ​ 《庆余年》是作家猫腻的小说。这部从2007年就开更的作品拥有固定的书迷群体,也在文学IP价值榜上有名。 ​ 期待已久的影视版的《庆余年》终于播出了,一直很担心它会走一遍《盗墓笔记》的

  • 记录nodejs实现微博第三方登录2019-11-19 11:53:43

    2019-11-19 前置工作: 在微博开放平台准备一个审核通过的应用;(我的是一个h5页面)https://open.weibo.com/ (开发过程参考了大佬的文章:https://cloud.tencent.com/developer/article/1441425 大佬写得非常详细了;) 相应的回调地址及IP地址改成自己相应的地址即可。   代码实现: 1.前端

  • python--Ajax2019-10-12 20:00:10

    我们在用requests抓取页面的时候,得到的结果可能和在浏览器中看到的不一样,是因为requests抓取的都是原始的HTML文档,而浏览器中的页面则是经过JavaScript处理数据后生成的结果,这些数据都来源有多种可能是通过Ajax加载的,可能是包含在HTML文档中的,也可能是经过JavaScript和特定算法计

  • 自我的SZ2019-09-13 10:56:04

    https://weibo.com/cissy19770920?profile_ftype=1&is_all=1#_rnd1568342587042 我不希望年轻人在打拼的时候,天天耗在网络上,迷失在每一条看似有用的信息里,我更不喜欢,大家在网络上崇拜任何一个人。所有的碎片知识,成就不了你。把这心思和精力,把手上的工作全神贯注做的比别人出色,走出

  • 我的第一个油猴脚本--微博超话自动签到2019-09-13 10:51:35

    简介 用户脚本是一段代码,它们能够优化您的网页浏览体验。安装之后,有些脚本能为网站添加新的功能,有些能使网站的界面更加易用,有些则能隐藏网站上烦人的部分内容。其中常见的有 油猴插件、ChromeExtentions <!--more--> 由于油猴脚本只用一个JS文档,因而相对于ChromeExtentions比较

  • PAT A1124 Raffle for Weibo Followers [模拟+STL]2019-09-05 15:01:02

    题目描述 链接 小明PAT考了满分,高兴之余决定发起微博转发抽奖活动,从转发的网友中按顺序每隔N个人就发出一个红包。请你编写程序帮助他确定中奖名单。注意:可能有人转发多次,但不能中奖多次。所以如果处于当前中奖位置的网友已经中过奖,则跳过他顺次取下一位。按照输入的顺序输出中奖

  • javascript – 在Greasemonkey脚本中,XPath没有在XHTML页面上选择正确的节点2019-09-01 16:34:47

    我正在为weibo.com制作Greasemonkey脚本.我无法在XHTML页面上使用XPath选择元素. 此代码无法获取我想要的元素: function resolver(prefix) { return prefix === 'x' ? 'http://www.w3.org/1999/xhtml' : null; } var allLinks, thisLink; allLinks = document.evaluate( "//

  • js调试-Weibo登录案例2019-08-28 20:04:07

    js调试 Weibo登录案例 1.分析流程 手动操作流程 访问首页https://weibo.com 输入用户名和密码 点击登录 如果有验证码,就输入验证码验证 成功跳转到微博首页面 请求流程分析过程 根据上面的手动操作流程,我们要分析出网站的http请求逻辑。 1.首页面请求分析 首先,打开谷歌浏

  • 【Python】Python3网络爬虫实战-35、Ajax数据爬取2019-07-29 22:38:40

    有时候我们在用 Requests 抓取页面的时候,得到的结果可能和在浏览器中看到的是不一样的,在浏览器中可以看到正常显示的页面数据,但是使用 Requests 得到的结果并没有,这其中的原因是 Requests 获取的都是原始的 HTML 文档,而浏览器中的页面则是页面又经过 JavaScript 处理数据后

  • Python网络爬虫-模拟Ajax请求抓取微博2019-07-28 21:36:24

    Python模拟Ajax请求 有时候我们在用requests抓取页面的时候,得到的结果可能和在浏览器中看到的不一样:在浏览器中可以看到正常显示的页面数据,但是使用requests得到的结果并没有。这是因为requests获取到的都是原始的HTML静态文档,而浏览器中的页面则是经过javaScript处理数据后生

  • Test for weibo2019-06-30 18:28:07

    Test for weibo This is a test blog for sina weibo. Title1 ContentContentContentContentContentContentContentContentContentContentContentContentContent做出评价做出评价做出评价ContentContentContentContentContentContentContentContent做出评价做出评价做出评

  • Python Scrapy Selenium整合:启动浏览器并登陆2019-06-30 16:28:27

    某些网站要求用户必须先登录,然后才能获取网络数据,这样爬虫程序将无法随意爬取数据。 为了登录该网站,通常有两种做法: 直接用爬虫程序向网站的登录处理程序提交请求,将用户名、密码、验证码等作为请求参数,登录成功后记录登录后的 Cookie 数据。 使用真正的浏览器来模拟登录,然后记

  • “~" 的用法2019-06-15 19:52:22

    “~" 的用法   let arr = ['weixin','qq','weibo']console.log(arr.indexOf('aa'),~arr.indexOf('aa'),'aa') // 0 -1 "aa"console.log(arr.indexOf('weixin'),~arr.indexOf('weixi

  • 爬虫—Ajax数据爬取2019-05-29 17:00:54

    一、什么是Ajax   有时候我们使用浏览器查看页面正常显示的数据与使用requests抓取页面得到的数据不一致,这是因为requests获取的是原始的HTML文档,而浏览器中的页面是经过JavaScript处理数据后的结果。这些数据可能是通过Ajax加载的,可能包含HTML文档中,可能经过特定算法计算后生成

  • ArcGIS中国工具3.0正式发布2019-05-05 13:39:43

     ArcGIS中国工具3.0正式发布,新功能有 1.  支持面积分割(见4.6),见https://weibo.com/tv/v/HsM2ksYY3?fid=1034:4368578107884427 2.  地图打印时支持经纬网格(见3.6.4)https://weibo.com/tv/v/HsM2TE3Xm?fid=1034:4368578363739061 3.  固定纸张限定比例尺打印(见3.7)https://weibo.c

  • PAT 1076 Forwards on Weibo2019-05-03 14:38:30

    1076 Forwards on Weibo (30 分)   Weibo is known as the Chinese version of Twitter. One user on Weibo may have many followers, and may follow many other users as well. Hence a social network is formed with followers relations. When a user makes a pos

  • IDEA中没有了servlet选项2019-04-14 21:51:49

    之前学servlet的时候IDEA中是有这个选项的,但是学了Spring之后的今天突然返回来看之前写的代码,想创建一个servlet选项突然没有了,于是百度了一下解决方法,过程是这个样子的 没有!! 查看Weibo.iml文件 解决方法 在Weibo.iml中增加一句话: 然后保存,此时观察就会发现出现了servlet

  • Python中的urllib2019-04-06 18:42:24

    urllib提供了一系列URL的功能。   Get urllib的request模块可以非常方便的抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP响应: 例如,对豆瓣的一个URLhttps://opi.douban.com/v2/book/2129650进行抓取,并返回响应: from urllib import requestwith request.urlopen('http

  • PAT A1124 Raffle for Weibo Followers (20 分)2019-02-25 15:42:06

    John got a full mark on PAT. He was so happy that he decided to hold a raffle(抽奖) for his followers on Weibo -- that is, he would select winners from every N followers who forwarded his post, and give away gifts. Now you are supposed to help him generate

  • 《学习之道》第六章学习方法232019-02-10 14:47:29

      练习与小恶魔较劲   你是不是喜欢早上一起床先查查电子邮件,逛逛weibo?你可以改变一下,先定时工作10分钟,然后奖励自己上会儿网。让你惊讶的是,这个自我控制的小练习将你的一整天都充满对抗小恶魔的力量。   提醒:第一次坐下来尝试本方法,一些小恶魔会大肆尖叫抗议,好像要吃掉你的

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有