python – 从Image中提取文本

2019-07-22 09:58:00 阅读：234 来源： 互联网

标签：python text opencv tesseract text-extraction

二,我试图提取的数字类型

另一个样本

上面的图像是另一张图片的输出,我试图从中提取所有数字.我正在单独选择每个数字,执行图像变换(阈值处理,图像对比,平均然后对比),似乎没有提供可靠和强大的输出.

使用阈值处理效果很好,但提取的数字的亮度并不总是相同,因此需要调整阈值以使其准确.我需要一些每次都能发挥作用的东西.我正在寻找的输出类似于下图.执行图像转换后,图像通过Tesseract OCR运行.当通过Tesseract放置下面的图像等时,输出几乎总是正确的.

图像转换后的所需图像：

此外,并非所有数字都相同.无论数字的大小,我都需要这个.有人可以帮忙吗？

解决方法:

没有人,你可能不需要自己完成所有这些,OpenCV已经实现了OTSU二值化方法,这完全适合你的情况.基本上它假设输入强度分布是双模态的.因此试图找到最佳阈值.您可以阅读更多here.这里是小代码以及生成的输出.

import cv2

img = cv2.imread("/home/abc/Downloads/1ltYB.png", 0)
ret, thresh = cv2.threshold(img, 10, 255, cv2.THRESH_OTSU)

print "Threshold selected : ", ret
cv2.imwrite("./debug.png", thresh)

输入:(我已裁剪图像以删除额外的填充)

输出：

标签：python,text,opencv,tesseract,text-extraction
来源： https://codeday.me/bug/20190722/1501774.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

python – 从Image中提取文本