ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

用python识别图片

2022-06-25 11:02:16  阅读:178  来源: 互联网

标签:tesseract python 路径 tessdata pytesseract pip 识别 安装 图片


用python识别图片

先下载tesseract

网址:https://digi.bib.uni-mannheim.de/tesseract/

image-20220624233328140

里面有各种.exe下载文件,其中带dev的是开发版本,不带dev的是稳定版本,我们选一个稳定版本下载即可

下载好之后直接安装就可以

image-20220624233744675

这一步可以选择支持的语言包,后面一直next就可以

为了在python中可以使用tesseract功能,使用pip安装pytesseract,pillow,在cmd里打以下命令就可以,如果有错误可能是pip没更新到最新的版本

pip install --upgrade pip
pip install pytesseract
pip install pillow

然后配置tesseract的环境变量,在path的系统变量中新建一项

image-20220625094148868

image-20220625094223787

把Tesseract—OCR这个安装目录放在这个环境变量下

然后再新建一个系统变量,放的是tessdata的目录

image-20220625100522242

这样就配置好了

然后在命令行输入以下命令,查看是否配置成功

image-20220625094706214

出现版本信息就表明环境变量配置成功

然后就可以开始识别了

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'E:\Tesseract-OCR\tesseract.exe'#这个放上自己安装的exe的路径就可以
tessdata_dir_config = r'--tessdata-dir "E:\Tesseract-OCR\tessdata"'#这个也是自己安装的路径,这个tessdata也在那个安装目录下

image=Image.open(r"C:\Users\jkx\Desktop\misc2.png")
#图片路径
code = pytesseract.image_to_string(image, config=tessdata_dir_config)

print(code)

image-20220625100053439

前面的r的意思是让后面的路径识别为字符,防止出现把\当成转义符的问题

或者是在命令行输入以下命令

image-20220625095949963

识别成功后,它会自动生成misc2.txt的文件

中间的是图片的路径

image-20220625100111322

标签:tesseract,python,路径,tessdata,pytesseract,pip,识别,安装,图片
来源: https://www.cnblogs.com/Jinx8823/p/16410904.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有