ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

电影天堂python脚本

2019-03-10 10:51:11  阅读:379  来源: 互联网

标签:脚本 csv name python heat html link urls 天堂


电影天堂python脚本

import requests #导入requests库
from lxml import etree
from lxml import html
import csv

movieUrls =[]
urls=[]
start_url='https://www.dygod.net/html/gndy/dyzz/index.html'
def url_link():                                  #定义函数    
    urls.append(start_url)
    for k in range(1,3):
        url='https://www.dygod.net/html/gndy/dyzz/index_'+str(k)+'.html'
        urls.append(url)
        
def html_heat(urls):                                  #定义函数    
    for index4,index3 in enumerate(urls):
        heat=requests.get(index3)                     #下载网站内容
        heat.encoding =heat.apparent_encoding#解决乱码
        soup1=html.fromstring(heat.text)
        news=soup1.xpath('//*[@class="ulink"]/@href')
        for j in news:
            m='https://www.dygod.net/'+j
            movieUrls.append(m)

def movie(movieUrls):                                  #定义函数
    for index1,index in enumerate(movieUrls):
        heat1=requests.get(index)                     #下载网站内容
        heat1.encoding =heat1.apparent_encoding#解决乱码
        soup2=html.fromstring(heat1.text)
        result2=soup2.xpath('//table[2]//tbody//tr//td//a/@href')
        result3=soup2.xpath('//div/div[3]/div/div[4]/div[1]/h1/text()')
        for link in result2:
            for name in result3:
                item={                          #将获取的结果存储为字典
                    "name":name,
                    "link":link
                }
                save_result(item)               #每次获取一个结果后,存储一次
                item.clear()                    #存储后清空字典,为下次存储做准备

def save_result(item):                      #存储结果
    with open('dytt.csv','a',newline='',encoding='utf-8') as csvfile:   #打开一个csv文件,用于存储
        fieldnames=['name','link']
        writer=csv.DictWriter(csvfile,fieldnames=fieldnames)
        writer.writerow(item)

def main():                                          #主程序
    with open('dytt.csv','a',newline='') as csvfile:   #写入表头
        writer=csv.writer(csvfile)            
        writer.writerow(['name','link'])
    headers = {
    'User_Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',}
    url_link()
    html_heat(urls)
    movie (movieUrls)
if __name__ == '__main__':     #运行主程序
    main()

转发自宁波斯谱瑞环保科技有限公司(www.nb-spring.cn

标签:脚本,csv,name,python,heat,html,link,urls,天堂
来源: https://blog.csdn.net/yml1984/article/details/88375021

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有