Re: [FB] 創世神ptt:鄉民自製五毛大數據分析

作者: VXcc (vX)   2018-10-15 01:24:20
※ 引述《cgi0911 (勝者的迷思)》之銘言:
: 最近有些網路安全廠商在推一種人工智能的「寫作風格分析」。
: 買帳號不難,要雇用少數人去操作幾千上萬的帳號,甚至是二十四小
: 時輪班駐點玩輿論轟炸都不難。
: 但是有一個東西是幾乎無法被複製的,那就是寫作風格。
: 我記得這幾天有些耐人尋味的新聞。一個是參議員馬侃過世時,紐約
: 時報上發表了一篇紀念馬侃、批評川普的匿名投書。結果有研究者把
: 這篇投書丟去做寫作風格分析,發現這篇文章的寫作風格竟然跟副總
: 統彭斯(或是他的文膽,whatever)非常相似。一時引發喧然大波。
: 另一個比較沒那麼新的新聞是,中國有人把《紅樓夢》一百二十回丟
: 下去做一個簡單的詞語頻率分析。結果得出了前八十回和後四十回確
: 實是不同人的寫作風格,從旁佐證了「前八十回出自曹雪芹、後四十
: 回是高鶚所續」的假說。
400好友還不用擔心啦
http://news.ltn.com.tw/news/world/breakingnews/2546591
那篇文章是因為使用罕見詞彙才會被認為和彭斯是同一人啦
還是人類抓的
這種抓法和泥巴戰沒啥區別
根本沒一刀斃命的證據
就算給AI抓
除非他能把全世界的文章都蒐集起來
不然也難以證明是某一人發的
更別說文風是可以模仿
除非你要寫小說幾十萬字
那另當別論
嘻嘻
: 我不是機器學習專家,但上述的分析技巧並不難,而且日益精進。如
: 果我們用爬文機器人,把批踢、臉書和水管上面數以萬計的推文丟進
: 去分析,說不定會有一些有趣的發現呢?
: 把新聞轉貼或「1124滅東廠」這種已經成為複製貼上的口號先剃
: 除掉不管,專挑長度夠長的推文來看,我們會不會發現,同一個帳號
: 底下出現好幾個不同的寫作風格(意味著這個帳號有好幾個人在輪班
: 使用),或是成千上萬個帳號連結到同一個寫作風格(意味著一個寫
: 手操作好多個帳號),甚至是公關公司的暗稿呢?
: 如果版上有擅長機器學習且願意投入時間的朋友,說不定可以往這個
: 方向去探索看看。

Links booklink

Contact Us: admin [ a t ] ucptt.com