Re: [爆卦] i'Analyseur 新工具 爆文警示器

作者: orze04 (orz)   2018-11-15 20:49:41
※ 引述《ckckcck5577 (一堆神經病)》之銘言:
: ※ [本文轉錄自 HatePolitics 看板 #1RxKzk1K ]
: 作者: pohor (pohor) 看板: HatePolitics
: 標題: [爆卦] i'Analyseur 新工具 爆文警示器
: 時間: Thu Nov 15 18:50:18 2018
: 安 打給後
: 阿肥我又來了 這次帶來新的分析工具
: ★㊣↙ i'Analyseur a 爆文警示器 ↗㊣☆
: https://www.ianalyseur.org/trend/
: 阿肥一直在想,從推文有沒有辦法系統化的找出帶風向的端倪呢?
: 經過7749天的辛苦研發,終於讓阿肥頓悟啦
: 直接講案例
: 請看 http://bit.ly/2A3ZwRJ
: 如果你不想開google drive 以下是部分截圖
: https://i.imgur.com/MYVObpe.png
: 簡單說,這裡列出四篇文章
: 裡面有超過10個帳號,在發文的20分鐘之內,用幾乎一樣的順序推文
: 要知道八卦版這一年內有發文推噓文的帳號共有約12萬個
: 要出現相同10個帳號用一樣的順序推文的機率約是12萬的10次方,比中100次大樂透還難
: 更何況是有超過4篇的文章有這種現象 ( 有興趣的網友可以自己查查看,遠超過四篇)
幫補充下...這邊機率錯蠻大的
推文順序一樣的機率會跟總文章數有關
國中應該都算過班上人數超過多少時,有50%機率至少有兩人生日一樣
隨便抓10個帳號,他們在N篇文章中至少兩篇文章中推文順序相同的機率
P(在N篇文章中至少有兩篇文章中推文順序相同)
= 1-P(在N篇文章中所有推文順序相異)
10個帳號有3628800種排列組合方式
= 1-(1 * 3628799/3628800 * 3628798/3628800......(3628800-(N-1)/3628800) )
= 1-( (3628800!/(3628800-N)!/3628800N)
假設N=2000
= 1-0.5767
= 0.42
特定10個ID,在2000篇文章中42%機率順序會一樣
不過大前提是他們都有在這2000篇中出現
光是會出現推文就是一個重大意義,就算某C開頭的柯黑也沒有每篇都出現
時間鄰近程度、議題接近才是最重要的指標
: 還是在發文20分鐘之內
: 以機率來說這非常不合理
: 在google drive的那個sheet共列出4篇文章
: 我保留了該段區間的其他推文者,避免又被說阿肥我造假了
: 如果原文被砍,別擔心還有備份站都幫您準備好了
: 異常的推文用橘色標注,並標上編號
: 以第一篇來說
: 編號 1 是 kopak0910,下一個推的是 k418026 但是他是插花的,所以沒有標橘色
: 再往下編號 2 是 lim15015,... 依此類推 總共有 13個標橘色的可疑帳號參與
: 第二篇也可以看到 kopak0910 -> lim15015 -> jason31831…
: 同樣的順序只是中間插花的人不同
: 第三篇也維持一樣的順序,但是編號8的 B0091309 這次沒有參與
: 第四篇編號4, 6 的順序稍微有點亂,其餘則維持原來的順序
: 這麼低的機率,都發生在某個特定的議題上
: 這不是帶風向,那什麼才是帶風向呢?
其實這個問題網軍以後只要增加殭屍帳號數量就好
ex: 網軍數量增加5倍 C(100,10) -> C(500,10)
重複機率就從等比級數下降了
直接實名制,ban掉非台灣使用者就好

Links booklink

Contact Us: admin [ a t ] ucptt.com