北市民調背後的統計暗號
王宏恩 2014年10月18日 09:31
這張圖過忙:
今年的縣市長選舉中,台北市長選舉可說是全國關注的焦點,施測的民調機構及施測次數也相較歷年各次選舉或今年其它縣市皆來得多非常多。光從網民從各家媒體上提供的民調結果,就至少已經有14家機構公佈了64份民調,而這甚至還沒有進入『合法競選期』的投票前一個月內。各家民調不可避免的會有機構效應,而各家執行長對於未決定選民及未涵蓋選民的分配預測方式也各顯神通,但從目前已經公佈的民調結果來進行簡單的統計分析,就可以看到許多有趣的現象出現。為了控制機構效應的影響,我選擇四家已公佈超過8次北市民調結果的TVBS、蘋果、旺旺中時及趨勢作為分析。
首先,從去年開始的民調結果至今,無黨籍候選人柯文哲的支持度平均而言是緩慢攀升的,這在趨勢以外的另三家都有顯著的趨勢;相較之下,國民黨籍候選人連勝文的支持率平均而言變化不大,甚至在TVBS的資料中支持度慢慢下降。而未決定選民平均而言也慢慢降低。
但這變化從何而來?假如進一步用相關係數或時間序列分析(因為樣本數過小會有些問題),在四份資料庫中呈現了一致的趨勢:柯文哲的得票變化跟連勝文的得票變化是沒有相互影響的,柯文哲的得票變化跟未決定選民的變化率是顯著的負相關、連勝文的得票變化跟未決定選民數也毫無顯著關連。更清楚的說,這場台北市長大戰至今為止都是『柯文哲在跟自己作戰』─提出好政策就多爭得些未表態選民表達支持、一時失言就讓支持者變回未表態。連勝文至今沒有顯著得讓未決定選民轉而表態挺連、更別提從柯P支持者爭取投誠(也許個案會有,但總體數字互相抵消),看起來真的像是在一直玩一直玩一直玩。透過控制民調機構下的分析,我們可以看到整場選戰至今的動態過程。
另一方面,從民調數字到最後的選舉結果,中間有兩大落差:一是未表態選民、二是未涵蓋選民。未表態選民就是各家民調數字裡會看到的未表態者,可能是不知道要投誰、不想投、或是還沒拿到村里長的『指示』。而未涵蓋選民中,包括了在中國工作的200萬人、在美國工作的100萬人、以及一些在現在主流的電話民調中無法被觸及到的民眾,例如晚上要工作的人、沒有室內電話的人、在家卻不是負責接電話的人等。這些民眾出來投票的機率及政黨偏向,是民調中無法測得的,也可能影響最終的結果。就過往的民調經驗來說,這些沒測到的選民較多人是親綠的,但也會隨著時間及候選人屬性變化,例如2010及2012年中蔡英文的特質,使得隱性選民裡從泛綠較多變成藍綠各半,造成選舉預測上的挑戰(或可見筆者這篇民調分析)。本次台北市長柯P及連勝文的特殊屬性,想必會對選舉預測上更為困難,大家不彷期待一下哪家民調機構會最後猜對勝選者。
最後,隨著戰況激烈,在滿天飛的民調中也開始出現了推手民調Push Poll。所謂的推手民調,是指以偽裝成民意調查的方式,提供選民針對特定候選人大量不利的訊息,為負面選戰宣傳的一種,並非民意調查,其目的並非想測得實際民意,而是要影響選舉結果。推手民調因為偽裝成民意調查,往往受到正規民調學者及業者的不齒,因為會影響到民意調查這四個字的聲譽。要辨別推手民調最簡單的方式,就是去找原本的民調問卷全文,假如大多是針對特定候選人的負面描述、負面詢問、甚至夾雜不實的指控,這就已經不只是誘導式民調的問題,而是偽裝成民調、消費民調來進行負面選舉而已。
沒有留言:
張貼留言