[問題] 請教刪除中文字之間的空白

作者: atrisk (atrisk)   2018-08-06 05:37:30
大家好:
搜尋 ([一-龥,。:“”、‘’;\[\]])(\s+)([一-龥,。:“”、‘’;\[\]])
替代 \1\3
上面的方法是我在網路上找到用來刪除中文字和中文字之間(包含些標點符號)
的多餘空白,因為使用OCR軟體辨識中文時一定會出現這現象。
一直沒辦法讓OCR軟體事先避免產生空格(OCR軟體好笨?!),所以只能事後做補救。
有些好奇項目1(和項目3)為何加\[\],不知有無特別的意義?是作者考慮不夠周詳嗎?
因為既然已經將[和]放入搜尋條件內了,為何不將類似的<和>等等也放進來?
謝謝!
作者: LPH66 (-6.2598534e+18f)   2018-08-06 21:54:00
正規表示式的 [ ] 是字元集, 表示 [ ] 之間的任一字元例 [ABC] 表示 A 或 B 或 C, 但不含 [ ] 兩個字不過我不太清楚為何目標是全型字元的這條正規式會想加入半型的 [ ] 就是了

Links booklink

Contact Us: admin [ a t ] ucptt.com