[討論] 自炊PDF重排版不需OCR

作者: arkr (海龜仔)   2020-01-07 20:04:17
各位版友好,書版第一次發文請大家多多指教。
手機發文,若是排版跑掉還請大家海涵。
更新版友意見
1. viaggiatore:富士通 Scan Snap ix500軟體隨附文字辨識軟體,可掃描時生成可供搜尋
的檔案
2. decorum:使用koreader重排版可直接在閱讀器操作,但中文書無法選取文字否則會重啟
,至今開發團隊無解
最近開始嘗試自炊,但因為手邊沒有適合的OCR軟體,同時聽說中文OCR辨識率非百分之百,
且我無意花心力校正,因此嘗試以K2pdfopt重排版的方式處理掃描後的檔案。
以下是我嘗試歸納後的流程,提供給有興趣自炊的版友參考。
書籍類型:直排書,單欄,純文字
軟體需求
1. PDF編輯軟體:可裁切、旋轉(eg. Adobe Acrobat)
2. K2pdfopt:重排版
步驟
1. 掃描生成PDF檔
2. 以編輯軟體裁切白邊,僅保留文本。頁碼與天地的章節名稱會影響重排版效果,建議切

3. 以K2pdfopt進行重排版,以下為設定步驟,未註明表示保持預設(default),以Kindle 8
為例
3.1 Add file
3.2 Device選Kindle 1-5。若沒有合適機型須於Additional options欄位鍵入-fc-後調
整參數
3.3 Additional options欄位鍵入 -rt 90 -ls
3.4 Max columns調整為1
3.5 下方勾選Smart line breaks (調整為0.001)、Re-flow text、Fast Preview
3.6 右下方Preview重排版後的頁面,可以多看幾頁確認。此時頁面為上下顛倒,是正
常的
3.7 Convert All Files輸出檔案
4. PDF編輯軟體旋轉180度,完成
用本方法可以規避OCR後的校正問題,並維持直排書排版,並可適用於6吋或各種尺寸的閱讀
器。但若是書籍排版方式複雜(例如圖文夾雜),可能要多加嘗試調整參數,或乾脆使用大尺
寸閱讀器。
祝大家自炊順利。
參考資料
直排書重排版參數設定 https://www.mobileread.com/forums/showthread.php?t=144711&p
age=91
作者: nnlife (恩尼)   2020-01-07 22:36:00
推個
作者: p597fg (Jay)   2020-01-08 08:03:00
想請問這個軟體可以用來重排直書的自炊檔嗎?抱歉 剛剛沒注意看到
作者: pshuang (中山先生忠實信徒-我愛蘿)   2020-01-08 10:04:00
請問是用哪一種設備掃描?
作者: viaggiatore (▁音)   2020-01-08 13:29:00
推個。不過我想另外知道有沒有校正圖片傾斜更快的輔助軟體或方法? 用PHOTOSHOP一張張校正傾斜圖片太慢至於轉為可搜尋文字在我使用的富士通Scan Snap ix500隨機附贈的軟體就很好用了,比較沒有文字辨識的問題
作者: p597fg (Jay)   2020-01-08 14:08:00
Scan Tailor糾偏好用,但是只吃圖片檔
作者: decorum (Festina Lente)   2020-01-08 14:42:00
橫排的在Koreader上reflow的效果還不錯 不過中文書籍在重排過後 不能劃選文字 會造成軟體重啟 開發團隊至今解決不了 這頗為嚴重 因為不能摘要、劃重點、查字典幸好問題只在中文書上發生
作者: rerun (禮讓)   2020-01-08 15:52:00
看書這麼累
作者: viaggiatore (▁音)   2020-01-09 02:50:00
在 Scan Snap 檔案選項中就有選取OCR口轉換成可搜尋的PDF檔案 (這項打勾)我的書都拆好的,但是很多本身就印歪了,或者是紙張吸入掃描時很容易頃斜一點點,檔案也跟著傾斜我用的不是平台式的掃(CZUR那種),而是很像印表機一直吸入紙張掃描很快的那種。實際使用那種機器就會想書看得再多也比不上掃描器,但怎麼用出來是人的能耐在那種機器問世後誇耀書看得多少顯得沒有意義..謝謝arkr p597fg提供的資訊,可以處理圖檔就很夠用,因為我可以把多個JPG圖檔用軟體工具轉成一個PDF

Links booklink

Contact Us: admin [ a t ] ucptt.com