[問題] 存檔和LOOP ibgvdlbj PTT批踢踢實業坊

[問題] 存檔和LOOP

作者: ibgvdlbj (:)) 2019-08-18 14:54:50

Hi 各位大大我又上來請教大家了
目前想用python識別pdf檔做 key word 查尋
也就是 optical character recognition
昨天朋友說 pytesseract 只能識別圖片不能識別 pdf檔
所以我先手動把其中一個pdf檔存成圖檔當測試
寫了一段code 成功的輸出在 cmd裡
目前在思考能不能儲存成text檔(格式會跑掉嗎?)
然後讓程式讀取資料夾內的下一個 pdf 檔案自行轉成圖檔後再跑~~
如果以上有可能的話
該怎麼寫呢? 麻煩各位大大謝謝^^"
以下放code:
from PIL import Image
import pytesseract
import argparse
import cv2
import os
# construct the argument parse and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-i", "

作者: eamansf96xs (草爺) 2019-08-18 19:28:00

這版有點少人。。。幫你推個

作者: mirror0227 (鏡子) 2019-08-18 20:33:00

我猜你在尋找 pickle

作者: s860134 (s860134) 2019-08-18 23:32:00

for loop 和 os. path 就可以做完了

作者: ibgvdlbj (:)) 2019-08-19 06:51:00

請問S大，應該要放在哪裡呢？謝謝！

繼續閱讀

[問題] 請教切字串love113w Dataframe問題求解gene50814 [問題] 如何畫出自定義圖像clansoda [問題］tkinter label/button 無法顯示Jackylover [問題] GCP 上 django 如何用 memcachef496328mm [問題] 身分證條碼wii8898333 [問題] contiune可以不要整個迴圈重來嗎?fm4n3fm4n3 [閒聊] Python有沒有社群可以交流?applebg [問題] selenium按鍵元素被攔截yuuyoru Re: [問題] 遞迴寫法cutekid