ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python读取PDF文件中的数据

2022-09-02 00:35:10  阅读:228  来源: 互联网

标签:pdfplumber 12 读取 python 30 2021 pdf PDF 票房


# -*- coding: utf-8 -*-
# 模块的安装与导入 由于pdfplumber和PyPDF2都属于第三方开源模块 因此需要我们额外安装
# 安装 pip install pdfplumber
# pip install PyPDF2

import pdfplumber


# 提取pdf第一页数据
def demo1():
    with pdfplumber.open('file/7_2.pdf') as pdf:
        page2 = pdf.pages[0]
        print(page2.extract_text())
        pdf.close()


# 提取PDF文档中的所有文本,可用for循环
def demo2():
    with pdfplumber.open('file/7_2.pdf') as pdf:
        page_list = pdf.pages
        for page in page_list:
            print(page.extract_text())
        pdf.close()


demo1()
demo2()

PDF数据文件运行结果

根据国家电影局的发布数据,2021 年中国电影市场累计票房
达到 472.58 亿元,恢复至疫情前的 74%,电影市场总票房保持全球
第一。
国产电影票房为 399.27 亿元,占总票房的 84.49%,城市院线观影
人次达到 11.67 亿。
2021 年度票房 TOP3 影片分别为:


根据国家电影局的发布数据,2021 年中国电影市场累计票房
达到 472.58 亿元,恢复至疫情前的 74%,电影市场总票房保持全球
第一。
国产电影票房为 399.27 亿元,占总票房的 84.49%,城市院线观影
人次达到 11.67 亿。
2021 年度票房 TOP3 影片分别为:
2021 年年度票房 TOP20 影片
排名 上映日期 影片名称 总票房(亿)
1 2021/9/30 长津湖 57.7
2 2021/2/12 你好,李焕英 54.1
3 2021/2/12 唐人街探案3 45.2
4 2021/9/30 我和我的父辈 14.8
5 2021/5/21 速度与激情9 13.9
6 2021/7/30 怒火·重案 13.3
7 2021/7/9 中国医生 13.3
8 2021/3/26 哥斯拉大战金刚 12.3
9 2020/12/31 送你一朵小红花 12.0
10 2021/4/30 悬崖之上 11.9
11 2021/2/12 刺杀小说家 10.4
12 2021/11/11 扬名立万 9.2
13 2021/4/2 我的姐姐 8.6
14 2021/12/17 误杀2 8.4
15 2021/4/30 你的婚礼 7.9
16 2021/2/12 人潮汹涌 7.6
17 2020/12/24 拆弹专家2 7.1
18 2020/12/31 温暖的抱抱 6.7
19 2021/8/27 失控玩家 6.1
20 2021/7/23 白蛇2:青蛇劫起 5.8
数据来源:中国电影数据信息网

标签:pdfplumber,12,读取,python,30,2021,pdf,PDF,票房
来源: https://www.cnblogs.com/zhaoyiguang/p/16648289.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有