Re: [問卦] 有沒有三方的統計學都超級爛的八卦

作者: brian900530 (LmWAng9)   2023-11-19 06:54:22
首先 抽樣誤差是在統計學上本來就會有的限制

只是用機率的形式來展現

拿抽樣誤差3%6%來說要讓幾% 根本就在亂用

到底指的是民調數字讓3%?讓抽樣誤差?

還是只要沒有統計上的顯著差異就讓?

講的不清不楚

更別說兩黨在比的東西不一樣吵的東西也不一樣

一邊比差距的差距,一邊比柯侯-侯柯

一個是相對數字一個是絕對數字

兩邊所謂的3%6%指的根本就不是同一件事

到底在吵什麼,也完全是看不懂



假設有效樣本數1068 在95%信心水準下

誤差就是+-3%,舉例來說就是100的正負3

但這只能用在計算單一統計值的時候



藍白是把一個民調裡面的兩個統計值拿來相比



下面就直接節錄一些臉書上教授寫的文



支持率的差異不一定要超過兩倍的抽樣誤差(柯文哲說的6%)才會達到統計顯著

第一因為3%是保守最大值的估計,實際上的「抽樣誤差」通常會比3%小。

再者信賴區間有重疊也不代表沒有達到統計顯著

第二,兩個人的對比支持率是同一個民調做出來的,不是獨立樣本,不能忽略相關性。



———————————————————————

以下是同一民調不同問題得出的支持度應該怎麼比較:

https://i.imgur.com/4sM2ya6.jpg

以匯流為例,樣本數n = 2046,(1) 柯侯48.3%對比(2)賴蕭 39.2%,所以(1)-(2) = (3)



兩個統計量的差異的標準誤差是這樣算的 https://i.imgur.com/50DV1iY.jpg



sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )

=

sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)

= 0.021



因為柯侯: 賴蕭 是在同一個問題問的,支持柯侯就不會支持賴蕭 (互斥)

所以這兩個支持率的相關性是負數,這就是為什麼公式後面為什麼會多出2*p1*p2。



所以柯侯對比賴蕭的支持率要超過1.96*2.1% = 4.1%,才有統計上的差異。



同樣的方式可以算出(4)-(5)=(6),兩個統計量的差距的標準誤差是0.0207。

所以侯柯對比賴蕭的支持率也是超過1.96*2.07% = 4.1%,才有統計上的差異。



但是如果要直接比較柯侯對侯柯的支持度,就得考量到這是兩個不同問題得到的

而且支持柯侯的人也會比較傾向侯柯,所以相關性為正。



而(1)-(4)的標準誤差會長得像這樣

sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )

=

sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)

= ???



v 是柯侯跟侯柯在兩個問題的共變異數,得用原始資料去估計。



沒有v就算不下去



也就是說,不論是(3)-(6)=(7)還是(1)-(4)=(8)只要沒有原始數據

都算不出來應該怎麼決定有統計意義的差距。差距的誤差就不是抽樣誤差。



結論:

再怎麼說 藍白合民調比拼絕對不是拿兩個數字來相減然後說

喔你看在6%內然後另一邊說才不是明明是3%

這是需要民調專家學者去運算的
都已經找來兩個專業的來當裁判

原始數據都在這些人手上

明明是一翻兩瞪眼的東西結果演成這樣

所以我也看不懂朱立倫記者會到底在說什麼

至於柯說什麼3% 純粹是以為誤差值是固定3%

Links booklink

Contact Us: admin [ a t ] ucptt.com