Re: [轉錄] 用機器學習判定紅樓夢後40回是否曹雪芹

作者: freeunixer (御劍客)   2016-07-07 01:17:50
※ 引述《mited (太郎)》之銘言:
: 知乎:用機器學習判定紅樓夢後40回是否曹雪芹所寫
: https://zhuanlan.zhihu.com/p/21421723
: 所以,我們就更有信心說曹老先生沒有寫後40回了。
: 更多的機器學習有趣的玩法,我會在學習的過程中慢慢嘗試的。以上。
→ episold: 很有趣 但是以詞彙頻率來推斷作者 這feature太粗略了 07/06 23:36
→ episold: 再想想怎樣把「寫作風格」變成特徵吧 07/06 23:41
在中文系,很早以前就用這種方法在探討真偽的問題,
對於理盲濫情光嘴炮,只會喊母豬的十萬酸民眾來說...
啊,不是,不好意思,這裡不是我的主戰場.
我的意思是,對於大多數湊熱鬧的人來說,只看聲光特效爆炸規模還有女主角有沒有露,
但是對於有些堅持看門道的人來說,他們很在乎真假問題,比如說:
                  偽 經
在遠古時代,沒有引擎更沒有網路的時候,佛經傳佈非常局部,
你在北京看到最新最熱的佛經,有可能在閩、粵從來沒聽過.
有很多會是只聽說有這部經,但根本不知裡面寫什麼的情況.於是
所謂的托名偽作就會出現.
基本上這東西是這樣,不信都沒事,信了就麻煩,為什麼,因為不能亂信.信錯會出大事.
每個人都說他有一本夢遺大師譯的經,結果拿出來一對,靠夭,怎麼每本內容都很不一樣...
這下你要怎麼辦?觀落陰?擲爻?還是扶鸞?
跼限於時代性、地域性及個人背景,每個人會有每個人的一些翻譯特性.
比如說,鳩摩羅什譯的金剛經,完全沒有用到 空 這個字.
     玄奘    一堆經,名詞譯法都跟前人不太一樣,如,他不用 阿修羅 這譯名.
因此,有人會用語言學的一些方法,來檢視一些有爭議的所謂 oo 人的譯/著,
當然,這有些基本條件要滿足,就是要有其它可信的作品可以參考,不然,
如果傳聞某作者的著作就只有那麼 101 本要辨真偽,可能還是佛、菩薩自己來比較快...
作者: rpg1234pk (giveme5)   2016-07-07 01:37:00
為什麼書版要提母豬什麼的,實在想噓你...
作者: hereiam1022 (迴旋舞)   2016-07-07 06:55:00
推to 1F,客觀引用無須介懷。
作者: rainveil (多栗)   2016-07-07 09:30:00
作者: descent (「雄辯是銀,沉默是金」)   2016-07-07 18:28:00
作者: tak1130 (他們在爭什麼?)   2016-07-08 06:03:00

Links booklink

Contact Us: admin [ a t ] ucptt.com