[分享] OpenCC中文轉換python3

作者: yichen (蒼穹之下任我行)   2016-01-15 16:25:44
在做中文轉換, OpenCC強悍好用, 但是現階段的版本並沒有直接支援python,
pip中的opencc則是需要先安裝OpenCC, 用ctype載入, 在包裝跨平台上似乎較不便
於是用OpenCC本身的字典檔, 寫了純用python3的opencc, 不需要額外的套件
使用方式就是把opencc這個資料夾放到專案中, 然後import就可以了.
效能上沒有跟原本OpenCC比較過, 不過在字數不多的轉換上都還可以接受.
source code: https://github.com/yichen0831/opencc-python
使用範例:
from opencc import OpenCC
openCC = OpenCC('t2s') # 正體中文轉簡體中文
to_convert = '我要轉成簡體中文'
converted = openCC.convert(to_convert)
原本OpenCC所有的轉換都可以使用,如hk2s, s2twp等等.
目前有的問題是如果轉換字詞時, 有兩種以上的可能時, 程式只會取第一個來用
如果有問題或改進的建議, 歡迎交流指教!
作者: uranusjr (←這人是超級笨蛋)   2016-01-15 17:48:00
可以考慮把它變成一個 package, 方便 pip install只要加 setup.py 與一個 MANIFEST.in (用來標示哪些檔案需要被安裝) 即可, 散佈起來會方便很多另外你 redistribute OpenCC 設定檔應該附上他們的授權
作者: yichen (蒼穹之下任我行)   2016-01-15 19:52:00
謝謝提醒,我來研究一下如何弄成package以及授權的問題

Links booklink

Contact Us: admin [ a t ] ucptt.com