[資料] 試用隱馬克夫鍊做台羅轉換漢字的程式

作者: yoxem (Yoxem)   2024-03-20 20:29:32
官話版摘要在下面
小弟算講是閩南語維基ê顧站工,最近hām有志討論講閩南語維基(主要用POJ/TL)
寫ê議題,我著想講敢有會當kā羅馬字轉做漢字ê方法?
因為tse hām輸入法揀字原理相siâng,我最近tshiau著輸入法自動揀字ê方法,
其中一个是Hidden Markov Model。
因為大學Markov鍊仔無學予好,所以著開始重頭學,提教育部ê辭典資料,轉做(TL-
漢字)ê平行語料,然後算出來文字轉移ê頻率,寫做一个Script:pakkau(tuì北溝
號ê),用Python,會當將教育部臺羅拼音轉做漢字。
毋過有無準ê所在:
INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng
OUTPUT: 耶穌講,上帝疼痛世間人
作者: MilchFlasche (實踐才能發光)   2024-03-21 08:45:00
感動咱用技術鬥處理語文代誌Lohankha作者有創這:https://tinyurl.com/2c34yymt共鶴佬話Wikipedia全白話字做一个mirror site,全轉漢字。毋閣伊个site這馬袂當用
作者: RungTai (RungTai)   2024-03-21 22:53:00
有神緊拜~

Links booklink

Contact Us: admin [ a t ] ucptt.com