Re: [討論] 民眾黨內參民調原始數字流出

作者: NewYAWARA (朝霞之前奏)   2023-12-11 20:46:20
※ 引述《a10141013 (FlyBall)》之銘言:
: https://i.imgur.com/pkUMcld.jpeg
[文長恕刪]
今天有索取到民眾黨官方寄來的所謂raw data資料,
有興趣的話可自行參閱: https://tinyurl.com/4tfhmhhv
以下是幾個比較明顯的問題點:
一、提供的並非是raw data資料
一般而言在民調上指的raw data,是指從調查或研究中直接收集到的數據,
這些數據在被記錄時尚未經過任何處理、分析或加權。
換言之,最好的情況是提供民調的SPSS檔讓人直接去做分析,
如果沒有的話,至少要包含市話加權前交叉表、手機加權前交叉表,
這樣才能更仔細的去做比對及推測使用的加權方式看看是否合理。
畢竟單純只說依照戶籍、年齡、性別、教育程度的多重反覆加權,
無法了解市話與手機合併時的各自樣本代表權重
(顯然不是單純的市話7手機3的比例下去合併)。
二、手機樣本的過度高估
由於民眾黨所提供的資料,並沒說明市話及手機整併時的權重,
但因為他們的交叉表有做「電話使用行為」,
所以大概可以推測是使用雙底冊方式整併。
但即使是雙底冊,也有不同的整併方式,這邊就不額外說明,
只是當民眾黨沒說明是怎麼整併時,我們不容易看出加權是否合理。
因為他們所提供的資料,沒有市話、手機在加權前的交叉分析表,
我們只能就手上既有的資料來做粗略的推論。
通常會出現問題的,就是在年輕樣本的估算上,
因為找到的樣本數少,所以一開始取樣時就容易有偏誤,
而願意接聽手機並作答的族群,有可能偏好與不接聽的有所不同,
就有可能會因此更加放大差異。
若我們就針對20-29歲的樣本來做粗略檢證的話,
我們得知加權後的柯盈配支持率是55.7%,
所以還原回來,樣本數是97份(174*0.557)。
而我們從柯盈配在市話加權後的數據是18.9%來看,
參照多數類似的市話民調,我們先假定在這個年齡層,
柯盈配拿到的是40%支持率左右,換算回來,
在市話的原始樣本則是22份(55*0.4),
接著從市話併手機的加權前數據,膨脹為加權後數據時,
權重是167%(104份樣本變174份樣本),
因此市話加權完後的樣本,則會因此膨脹為37份。
那麼,手機樣本在此佔多少呢?我們把加權完後總份數97份,
減掉市話樣本37份,所以我們可知手機樣本在加權後約佔60份。
而我們再把手機樣本還原為還沒加權前,大約是36份(60 / 1.67)。
36份則是佔手機加權前樣本的73.5%(36 / 49)。
換言之,柯盈配在手機的20-29歲原始樣本,可能是超過七成的支持率,
這與現實世界實際情況可能並不相符。
若是很單純的將市話及手機個別加權完後再整併,
那麼由於市話佔了70%的比重,在市話支持率40%、手機支持率73.4%的情況下,
整併後會是50%左右,會比兩種樣本先加起來,再開始加權後的55.7%要來的低。
而由於柯文哲佔優勢的30-39歲的樣本有著完全一樣的問題,
因此按照民眾黨的加權方式,對於柯文哲提升支持率就會有更大的幫助。
三、加權的不穩定
在這邊我們很明顯的會發現三個主要的問題:
1. 不同的加權方式會大幅影響最終的整併結果
2. 柯盈配在手機年輕樣本的支持率會有嚴重高估傾向
3. 手機看似只佔三成比重,實際上會因年輕樣本仍不足以彌補市話不足,
使得加權後會再更放大手機年輕樣本的偏誤(權重膨脹67%)
這也說明了為何純市話的加權後結果,
柯盈配的支持率僅是從13.2%膨脹為18.9%,
但是市話併手機後的結果,卻會大幅膨脹到27.6%的原因。
以上大概是幾點研究完民眾黨提供資料的想法,
最主要還是手機調查很可能會放大偏誤,
而市話併手機時,沒有詳細交代加權方式,
則會讓人無法信服,特別是在年齡加權會深刻影響結果時。
這些是民眾黨內參民調之後需要去克服的問題。

Links booklink

Contact Us: admin [ a t ] ucptt.com