Re: [閒聊] 起點網站部分文字無法轉繁體 gusion PTT批踢踢實業坊

Re: [閒聊] 起點網站部分文字無法轉繁體

作者: gusion 2020-11-29 23:22:14

最近做了一個chrome extension，把起點自定義的編碼轉換回去。
雖然基本功能已經有了，但其他功能還很簡陋
暫時還不打算上架，有興趣的可以先下載試用看看。
連結如下↓
https://github.com/lyroazo/qidian-proofreader/archive/v0.1.0.zip
安裝方式：
1. 下載擴充功能壓縮檔並解壓縮
2. 打開chrome擴充功能頁面，或者連到chrome://extensions/
3. 打開開發人員模式
4. 點選載入未封裝項目
5. 選取解壓縮的資料夾
辨識時間大約是載入完內文後約6~7秒鐘
辨識完會有訊息視窗跳出來
有時候辨識會有問題，可以重新整理換一個編碼組合
另外我有做快取功能，遇到以前辨識過的組合，就不用重新辨識，會快一點
由於我對javascript不是很熟，所以開發比較慢
也歡迎大家fork回去自己魔改
最後附上原始碼連結
https://github.com/lyroazo/qidian-proofreader/tree/master
※ 引述《linzero (【林】)》之銘言：
: : 有問題的會變成這樣
: :

: : 推 BenShiuan : https://i.imgur.com/dmI1ooe.jpg 看起來不像正常 10/31 14:41
: 顯示伴隨着
: 字碼伴隨#58016
: 58016轉16進位是E2A0
: Unicode碼裡E000~EFFF是私人造字區
: 也就是大家遵守的規範裡沒定義
: 這區是讓人自己私下定的
: 這區的字如何顯示是看個別系統而定
: 比方把冏rz 擠成一個字的寬度字形圖像
: 定義成E001
: 這樣字碼是E001(#57345)就會顯示成冏rz
: 但在別的系統就不是
: 可能無法顯示(不支持這字碼定義)
: 或者顯示別的(比如別系統定義成 ^_< )
: 應該是起點拿去定義中文字用
: 而起點網站系統有對應字
: 在起點系統上可以被正常顯示
: 而換個系統會有問題
: (所以有些盜版網站會有顯示 #....或看來像是亂碼的情況吧)
: 簡轉繁的機制
: 是把UNICODE碼裡的簡體字轉成UNICODE碼對應的繁體字
: 而這區自訂區的字，簡繁轉換機制無法處理
: 仍然用該字碼(像E2A0)
: 而這字碼是靠起點系統顯示的
: 所以簡繁轉換用自己的字形
: 起點自訂的字用自己訂的字形
: 且這自訂字形看來對應的是簡體
: 才造成兩者簡繁、字形不同的情況吧
: 不過着這個字UNICODE碼裡也有
: 不知起點為何要另外定義

繼續閱讀