Re: [閒聊] 中國科幻小說常見的老梗 漢語程式語言

作者: xobear (圈圈叉叉的熊)   2018-05-11 22:01:16
※ 引述《paresky (paresky)》之銘言:
: 說一個沒有直接關系但可證明中文也不一定簡潔的證據。
: 英文翻譯成中文的時候,用Word算出來的中文字數大約會是英文字數1.5倍。
: 真的要簡潔可能要靠文言文吧。
: (但文言文政治不正確呀)
: 志鳥村要開新書期待中。
這個說法不太正確。
英文一個「word」(數個字母組合)可以代表一個意義;
但中文很多時候一個「字」是沒辦法代表一個意義的。
例如:吉、他,這兩個字分開和合在一起意義是天差地遠。
因此在做NLP(自然語言處理)的時候,中文直接做效率很差,通常要先做斷詞處理。
所以我認為直接比字數沒辦法表示複雜度。
回到原話題,我還是覺得中文寫程式比較不好。
之前有人提到了,用中文編碼的話compile一定會比英文還久。
從資訊理論的角度來看,英文26個字母使用率最多的e和最少的z,也不過差一百多倍。
中文我不知道常用字和罕見字的數量差異,但我想最常用前一百字的使用率,相對於使用頻率一萬以後的字,應該遠遠超過一百倍。
換句話說,中文的資訊可壓縮率應該遠大於英文,複雜度也是啊!
也可以這麼說,中文寫程式就是會又臭又長,轉譯機械語言也會更久。
ps.看來很多道友都是資訊產業的,討論好熱烈啊XD
ps2.我不是資工畢業的,半路轉行軟工,有錯還請指正。
作者: chungminchun (酸旻)   2018-05-12 09:51:00

Links booklink

Contact Us: admin [ a t ] ucptt.com