Re: [討論] 嘸蝦米規則和中文日文韓文大一統

作者: deltazone (洋蔥)   2015-07-01 04:22:30
: OK 我懂了,現在我們想的是一樣的東西了…XDDD
: 那我想這大字庫至少需要定義幾項東西
: 首先是一個文字的拆碼
: 有點像廢話,不過這是實際的問題 XD
: 而為了達成前述跨語言整合的效果,需要有人去整理我所說的同源字有哪些
: 現行的編碼表應該已經有相當程度的整理了
嘿呀!其實很多碼現行的嘸蝦米都可以通,
如在簡體模式下用繁體的拆碼方式打lul 可以打出"龙"
: 否則做不到打繁出簡或日文模式的漢字輸出
: 所以重點就是缺口有哪些了
: 再來是該文字在各種模式下的優先序
: 更精確來說,應該是考慮該文字的某種特定拆法的優先序
: 這會關係到切模式時或是撞碼時排序的問題
: 像是「圍、葉、啐、囲、叶」通通拆 OJJ
: 哪些屬於繁中,哪些屬於簡中,哪些是日文?
: 如果不屬於該語言就可以不定義優先序,通通塞到最後面就好了
: 若是該語言中有這些字,但拆法來自不同語言
: 則可用該語言的拆法為優先,其他語言為後
: 若是這些字同屬於該語言,那最後就是走現行的編碼順序
: 所以打 OJJ
: 繁中模式可能會排成「圍、葉、啐、囲、叶」
: 日文模式可能會排成「囲、葉、叶、圍、啐」(其中「啐」在現行日文模式打不出來)
: 簡中…我懶得切輸入法了,同理推論 Orz
沒錯! andriod手機的limd-hd輸入法打嘸蝦米已經是這樣了!
也就是我說的"大字庫"概念,但沒有(簡日繁)模式可改變!
且limd-hd混雜了未完成碼先出現的概念(如打lul後面選字會出現lulk "襲")
這個先不提,不要混淆了!
: 既然合不合格是自由心證,那我的想法是:不要改
:
: 以上是日文程度 N95 的小弟一點見解 XD
日文方面你比我專業太多了!!!這點還是交給專業XD
: 這個我還真的不知道…(倒
: 不過就你前面對我提出的客群的回應,你最大的重點就是「走出台灣」
: 而手段之一是「讓嘸蝦米不只是中文輸入法」
: 這也沒有絕對的對或錯,就只是個方法
: 我的看法是,嘸蝦米現在本身的環境是封閉的
: 在不了解法律的狀況下
: 我怕對它的編碼表做什麼事,或是基於它衍生新的編碼表,並且公開
: 會不會有法律上的問題
: 於是只能龜在這裡打打嘴砲提建議,官方接不接受又是另一回事
: 至於沒內建、授權問題這些前人也提過很多次了
: 要是能走出這個封閉的環境,應該會比較好推廣
的確是個很實際的問題!!!
不想讓蝦米沒落呀!
: 我指的是像下面的狀況
: 比方說「對」這個字,在中文它很明顯非常常用,被指派了簡碼 A
: 但日文中「対」就沒有像中文那樣這麼常用
: 那這個簡碼在日文加速的效果就不明顯了
: 我明白你所說的切換語言模式不影響原本輸入速度的原因
: 但我的問題不在這裡
這個的確是問題!日文果然還是要專家來! XD
: 多少可以體會劉先生當初發明嘸蝦米的辛苦了吧 XD
: 這部分如果有辦法讓多人共同作業的話,可能會輕鬆一點
嘿呀!
======================================================================
最後提出當初想改變嘸蝦米,為何會想這麼改變的思路想法(除了推廣嘸蝦米之外)
主要要說明的有下面兩點:
一、大字庫 和 大一統東亞文字
二、模式(日繁簡韓)獨立
==========================================================================
一、大字庫 和 大一統東亞文字:
嘸蝦米是一個輸入法!
那電腦文字內碼,其實也是一種輸入法
(這裡所說的電腦文字內碼是如 GB 和 Big5 姑且稱為 [電腦內碼] )
為何說電腦內碼是一種輸入法?!
因有一種輸入法是輸入內碼 (中文的電腦內碼) 碼號,然後就可以打出中文
(我想這種輸入法日常應該沒人用,誰會去記無邏輯的電腦內碼)
其實嘸蝦米的編碼概念(或其他任何輸入法皆相似)
可以把它類比成 "電腦內碼"
(如lul=龍,lul是"龍"的碼)
作者: Frozenmouse (*冰之鼠*)   2015-07-01 07:54:00
我知道你的意思,不過你舉的「戶」剛好是反例
作者: deltazone (洋蔥)   2015-07-01 17:44:00
確實舉錯例! (羞)以前爬文看到unicode 在處理日韓簡繁 的漢字 是如此!以字碼 加 字型 去分野的概念! 不知後來是否有變?!概念不變 但一時參考了維基百科 舉了個 不好的例子XD

Links booklink

Contact Us: admin [ a t ] ucptt.com