文章詳情頁

如何使用Python進行PDF圖片識別OCR

瀏覽：12日期：2022-06-29 11:54:07

使用場景

使用圖片識別可以快速提取圖片中的信息，方便高效。

Python并不能直接對PDF進行識別，所以如果是識別PDF的話，需要先將PDF轉化為圖片，然后再進行識別。

必備工具 Python

可以安裝3.7及以上版本

tesseract-ocr

下載地址： https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

需要用到的庫

pip install pillowpip install opencv-pythonpip install fitzpip install PyMuPDFpip install pytesseract代碼示例

from PIL import Imageimport osimport pytesseract import cv2 as cvimport fitzdef pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle): # 打開PDF文件 pdf = fitz.open(pdfPath) # 逐頁讀取PDF for pg in range(0, pdf.pageCount): page = pdf[pg] # 設置縮放和旋轉系數(shù) trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle) pm = page.getPixmap(matrix=trans, alpha=False) # 開始寫圖像 pm.writePNG(imgPath+str(pg)+'.png') #pm.writePNG(imgPath) pdf.close()pdf_path =’D:/123.pdf’img_path =’D:/123.png’pdf_image(pdf_path,img_path,5,5,0)# 依賴opencvimg=cv.imread(img_path)text=pytesseract.image_to_string(Image.fromarray(img),lang=’chi_tra’)# 不依賴opencv寫法# text=pytesseract.image_to_string(Image.open(img_path))print(text)總結

識別清晰的文字圖片的時候準確率非常高

但是識別手寫體的話效果不太好

注意事項

在安裝tesseract-ocr 的時候一定要記得選擇對應的語言，不然是無法正常使用的。

以上就是如何使用Python進行PDF圖片識別OCR的詳細內(nèi)容，更多關于python pdf圖片識別ocr的資料請關注好吧啦網(wǎng)其它相關文章！

Python 編程

上一條：python將YUV420P文件轉PNG圖片格式的兩種方法下一條：python實現(xiàn)簡單的井字棋游戲(gui界面)

相關文章：

1. php模擬實現(xiàn)斗地主發(fā)牌2. Python random庫使用方法及異常處理方案3. 理解PHP5中static和const關鍵字4. spring acegi security 1.0.0 發(fā)布5. Vue封裝一個TodoList的案例與瀏覽器本地緩存的應用實現(xiàn)6. Vuex localStorage的具體使用7. jQuery 實現(xiàn)DOM元素拖拽交換位置的實例代碼8. .Net Core使用Coravel實現(xiàn)任務調度的完整步驟9. vue 使用localstorage實現(xiàn)面包屑的操作10. MyBatis中的JdbcType映射使用詳解

排行榜

					
					php模擬實現(xiàn)斗地主發(fā)牌
Docker 容器健康檢查機制
Python random庫使用方法及異常處理方案
.Net Core使用Coravel實現(xiàn)任務調度的完整步驟
Vuex localStorage的具體使用
jQuery 實現(xiàn)DOM元素拖拽交換位置的實例代碼
Vue封裝一個TodoList的案例與瀏覽器本地緩存的應用實現(xiàn)
MyBatis中的JdbcType映射使用詳解
idea給項目打war包的方法步驟
spring acegi security 1.0.0 發(fā)布
理解PHP5中static和const關鍵字