圖片處理 - python PIL 圖片放大的問題
問題描述
嘗試用pytesseract來識別一些圖片:
原始圖片尺寸較小,用pytesseract無法識別,開始嘗試用 Mac 自帶的預(yù)覽工具來放大尺寸 ,發(fā)現(xiàn)可以正常識別了,然后嘗試用 PIL 來放大圖片,代碼如下:
images.resize((1985, 336),Image.ANTIALIAS).save(’/images’, quality=95,dpi=(72, 72))
問題是,通過 PIL 放大的圖片不能被pytesseract 正常識別,我對比了兩張圖片的信息,如下圖:
發(fā)現(xiàn)除了圖片尺寸不同外,其他信息都是相同的,但是就是無法被pytesseract正常識別,所以求教如何用 PIL 放大出可以正常被pytesseract識別的圖片(其他工具也可以)
問題解答
回答1:你可以嘗試改變tesseract的-psm參數(shù):
image = Image.open(’ocr.png’)image.show()for p in range(4,14): print(p, ’-’, pytesseract.image_to_string(image, config='-psm {}'.format(p)))
輸出如下:
4 - 3 4’1 4’1 I] I]5 - DDd.d._...I._6 - 3 4’1 4’1 I] I]7 - 3 4’1 4’1 I] I]8 - 344009 - 3440010 - W11 - 3£1I1I]I]12 - 13 - 34400
如果圖片只有數(shù)字你也能嘗試用tessedit_char_whitelist:
pytesseract.image_to_string(image, config='-psm 8 -c tessedit_char_whitelist=1234567890')
相關(guān)文章:
1. javascript - node得到req不能得到boolean2. node.js - nodejs+express+vue3. 數(shù)據(jù)庫 - Mysql的存儲過程真的是個坑!求助下面的存儲過程哪里錯啦,實在是找不到哪里的問題了。4. mysql時間格式問題5. javascript - 我的站點貌似被別人克隆了, google 搜索特定文章,除了域名不一樣,其他的都一樣,如何解決?6. python對8000行csv添加列7. DADB.class.php文件的代碼怎么寫8. 使用mysql命令行連接遠程數(shù)據(jù)庫host跳轉(zhuǎn)9. java - web端百度網(wǎng)盤的一個操作為什么要分兩次請求服務(wù)器, 有什么好處嗎10. python 字符串匹配問題

網(wǎng)公網(wǎng)安備