Re: [閒聊] Project Coffee Jazz 詞彙用語正簡轉換

作者: danny0838 (道可道非常道)   2018-04-26 03:22:07
既然有人要入坑,就拿個很久前的舊作充數XD
https://github.com/danny0838/sts-lib
此專案的主要目標是提供能有效整理各種簡繁轉換對照表的框架,
供不同情境使用,以及幾個層次的轉換腳本。
主要程式語言是 Python + Shell Script (CMD)。
大部分轉換表資料來自OpenCC和維基百科,但後來做了不少整理。
因為是很古老的專案,充斥著很多不適合公開的版本記錄,
所以暫時先丟最新版本。之後有空整理再補上舊的版本歷程。
個人是建議如果可以的話,轉換表格式盡量用純文字檔,
日後用各種程式比對及整合會比較方便。
※ 引述《t7yang (t7: 攻城蝨)》之銘言:
: 不知道大家對這個 2016 年 11 月的一篇幻想文還有印象嗎?
: 現在他不只是幻想了,而且他還正要實現了。
: 當時我還只是一個剛上手寫 JS 而已,根本只是個許願文而已。
: 後來輾轉實力提升了不少,加上對新同文堂很不滿意
: 但是無奈現有的程式碼缺乏有效的管理,後來就選擇了自幹了
: 原本沒有沒有想要繼承新同文堂的,但是被 ett 拉了回來
: 所以就把這個代號改了一下,作為新同文堂 2.0 的開發代號
: Project Jazz Cafe NEED YOU (新同文堂 2.0 需要你)
: * 一組新的圖示(包含亮色系跟暗色系),可能還有其他的圖示
: (你可以設計你的版本,最後我們再來投票)
: * 重組字典檔專案(因應新的演算法和新增轉換用語預設字典檔)
: 對上述議題有興趣的人請聯絡我,我需要你的協助,或引介人才給我
作者: t7yang (t7: 我認為這是一種背叛)   2018-04-26 09:13:00
看起來不錯喔。當初也有想去opencc那裡借資源的,只是那個一對多的部分不好處理。如果你已經有處理好的東西可以用最好。儲存格式的話,最終還是要轉到JSON,瀏覽器那裡才能比較好處理多人共編處理的問題很重要,所以我其實是想直接用G社的試算表來維護,開發者再透過 CSV 去後製成 JSON 方到套件線上試算表的好處就是簡單、容易用、支援多人共同編輯還有版本控制。剩下的事情就是交給開發者去處理。補個推,一直沒推到
作者: oversky0 (oversky0)   2018-04-26 21:41:00
萌典有兩岸辭典。不過不知有沒有版權問題。兩岸詞典由中華文化總會提供,採用 CC BY-NC-ND 3.0 臺灣授權。https://www.moedict.tw/about.html
作者: karst10607 (誰可以協助我開板?)   2018-05-08 08:49:00
推,這部分我回來了,我會幫忙

Links booklink

Contact Us: admin [ a t ] ucptt.com