ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

成都新房二手房房价采集

2021-05-24 16:33:43  阅读:159  来源: 互联网

标签:采集 新房 链家 成都 二手房 数据 loop 限购


随着成都的发展进步,成都房屋也迎来的限购,无论是新房还是二手房都有限购,这样那些想买房的人也困难起来了。虽然限购了,但是也有解决限购的方法,比如拥有成都社保,成都户口等都可以参与购买房子。但是由于限购的问题,买房的人也越来越多,成都的房子也供不应求,也导致了成都的房价快速高涨,具体有多高,可以在各大房产平台去了解也可以采集链家的房价信息。
当然由于互联网的发展,网络上提供的数据信息也越来越多,大众可以利用互联网上的数据信息来寻找自己需求的房子,各大的房产平台上都会有数据信息显示。网络爬虫可以通过python爬虫对链家平台进行数据采集、数据分析,来统计一下成都各大新房的房价和二手的房价,选择一些心仪的房子。
采集链家的房产价格,其实很简单:
1、指定采集链家的网页和数据接口
2、从目标网页或数据接口中采集出所需要的数据信息
3、采集出来的数据信息进行分析,统计,归类,保存
无论是新房还是二手房都的价格都可以通过这种方式采集,链家的房产数据都是以列表的方式存在,比较容易采集。
以下就是采集链家的爬虫源码仅供参考:

    #! -*- encoding:utf-8 -*-

    import aiohttp, asyncio


    targetUrl = "http://httpbin.org/ip"

    # 代理服务器(产品官网 www.16yun.cn)
    proxyHost = "t.16yun.cn"
    proxyPort = "31111"

    # 代理验证信息
    proxyUser = "username"
    proxyPass = "password"

    proxyServer = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
        "host" : proxyHost,
        "port" : proxyPort,
        "user" : proxyUser,
        "pass" : proxyPass,
    }

    userAgent = "Chrome/83.0.4103.61"

    async def entry():
        conn = aiohttp.TCPConnector(verify_ssl=False)

        async with aiohttp.ClientSession(headers={"User-Agent": userAgent}, connector=conn) as session:
            async with session.get(targetUrl, proxy=proxyServer) as resp:
                body = await resp.read()

                print(resp.status)
                print(body)

    loop = asyncio.get_event_loop()
    loop.run_until_complete(entry())
    loop.run_forever()

标签:采集,新房,链家,成都,二手房,数据,loop,限购
来源: https://blog.csdn.net/Laicaling/article/details/117226037

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有