概要
このモデリング プロジェクトの目標は、公衆衛生、人口統計、および歴史的データを使用して 2024 年の選挙の結果を予測することでした。この独自のアプローチは、人口内の民主党に対する国民の支持の代理となる予測因子に依存しています。米国では、民主党か共和党かという二者択一に直面しており、選挙は各州の選挙人票によって決定されます。したがって、予測された応答指標は、単に州内の勝利の差でした。
選挙人団があるため、選挙を予測することは、基本的に少数の州を予測する問題です。ほとんどの州では、どちらかの政党が大差で勝利するという信頼できる実績がありますが、そうでない州もいくつかあります。データとモデルは、これらの州を正確に予測する限り正確です。最近の全国選挙のサンプル サイズが小さく、モデルでは最近のデータ ポイントが重要であるため、勝利の差が小さい州については、非常に正確な予測を行うことはできません。したがって、このモデルの成功は、現在世論調査で検出されているよりも民主党 (または共和党) への支持が高い可能性のある激戦州を検出できるかどうかにかかっています。
背景と前提
過去 2016 回の大統領選挙サイクルで、世論調査は大きな失敗をしました。2020 年には、ほぼすべての主要な世論調査機関とメディアが、重要な激戦州とラストベルトでトランプ氏の勝利につながった民主党員と無党派層からの世論の支持度を検知できませんでした。XNUMX 年、世論調査機関は再び、重要な州でのトランプ氏の支持を過小評価しました。それ以来、メディアの調査能力と真実の解明能力に対する信頼はさらに損なわれています。
この分析は、世論調査業界の偏りの弱点の影響を受けない、より正確な国民の政治的嗜好の状態を反映する予測因子を見つけることを目指しています。新型コロナウイルス感染症のパンデミックは極度に二極化しており、ワクチンへの支持が明確に分かれているため、毎年の「新しい」バージョンのワクチン接種に対する国民の接種率は、民主党への支持と高い相関関係にあります。毎年新しいワクチンが開発されているため、接種率が継続していることは民主党への投票の忠誠心を示していると考えられます。国内移住率や郵送投票の請求など、他の指標も過去19年間の民主党支持と高い相関関係にあります。
さらに、死亡率、出生率、メンタルヘルスなど、公衆衛生情報源からの人口データが制御変数または予測変数として使用されている。一部の人口動態および人口動態は共和党支持の州と関連しており、その他は民主党支持の州と関連しており、これらの関係は近年、長期にわたって維持されている。純移民率などの他の指標は強い関連性があるが、それらはより最近のものであり、新型コロナウイルス感染症のパンデミックの影響を受けたもので、その間、多くのロックダウン中の青い州では純損失が見られ、赤い州では純利益が見られた。現在では毎年行われている新型コロナウイルス感染症のワクチン接種の人気は年々低下しており、データは相対的な人気を測るために調整されており、平均よりも全体的な接種率が高い州は民主党の支持が高いことを反映している。
全体として、この分析は長期的な傾向と最近の傾向の両方を組み合わせて、民主党への現在の支持レベルを推定することを目指しています。モデルは、選挙前の数か月(新型コロナワクチン)と数週間(不在者投票請求)にのみ利用可能になったデータでトレーニングする必要があるため、土壇場での変化を検出することはできません。
ジョージ・ボックスは「すべてのモデルは間違っているが、いくつかは役に立つ」と言っています。この分析で私が期待しているのは、従来の選挙世論調査では見られないシグナルを検出するのに役立つかもしれないということです。予測(ほとんどは楽しみのため)に加えて、過去 4 年間に起こった重要な変化に光を当てるかもしれないと思う、激戦州の分析もいくつか含めました。
メソッド
選挙の文脈では説明可能性と解釈が重要であるため、私はシンプルなモデルにこだわっています。一般化線形モデリング、ロジスティック回帰、ランダムフォレストの各モデルはすべて、2020年から2022年のデータでトレーニングされました。結果、つまり応答は、民主党の勝利の差でした。ロジスティックモデルの場合、その州のXNUMX進法の勝利または敗北が予測されました。各モデルには独自の長所と短所があり、独自のエラー率もあるため、最終的な勝利または敗北の分類は多数決で決定されます。コードとデータをアップロードしました。 githubの誰でも批評、訂正、フィードバックを提供できます。
製品制限
各州の新型コロナウイルスワクチン接種率を予測因子として使用することにしたため、収集できるタイムラインとデータが制限されます。このため、モデルは民主党に偏ると思われます。19州のうち、50州が誤差範囲内に収まりました。これらXNUMX州はすべて、激戦州と見なされます。分類の目的上、私のモデルの誤差の範囲外に明らかに収まる州のみが、その政党の勝利として分類されます。誤差範囲内の州は、接戦として分類されます。
議論
米国では選挙は二者択一であるため、分析では民主党と共和党のみを対象とし、反対党の有権者の間での候補者への支持の変化を検出することはできません。これは、この選挙が依然として個々の候補者よりも党派への忠誠心が主な問題であるという、モデルの核となる仮定を明らかにしています。
民主党候補のカマラ・ハリス氏については、この想定は正しいと私は思う。彼女は予備選挙で一般投票で選ばれたわけではなく、選挙運動の大部分は、最近までほとんど無視され、退けられ、嘲笑さえされていた女性から戦略的に作り上げられたペルソナを作り上げることに注がれていたからだ。過去数か月間の討論会、暗殺未遂事件、その他の大きな出来事は、世論調査の傾向にまったく大きな影響を与えていないことがわかる。
ドナルド・トランプについては、この想定は当てはまらないと私は思う。トランプのよく知られたペルソナは支配的で、どこにでもいる。2017年から2021年までの大統領としての任期、そして訴訟、暗殺未遂、メディアの執着との継続的な戦いから、トランプの勝利は共和党よりも彼自身について多くを語っている。民主党は機械であり、共和党は党首間の内紛と分裂が何年も続いた後に、しぶしぶトランプへの支持を固めただけである。
このモデルは 2020 年の大統領選挙と 2022 年の上院選挙の両方のデータを使用しているため、政党支持をモデル化するようにトレーニングされており、それが本来の弱点となっています。最近の世論調査はトランプ氏に有利に傾いていますが、主要な激戦州では接戦が続いています。私の手法とこの演習の意図に忠実に従い、そのデータは一切含まれていません。
スイングステート分析
選挙の結果は、いくつかの州によって決まります。現在、アリゾナ、ネバダ、ウィスコンシン、ミシガン、ノースカロライナ、ジョージア、ペンシルベニアの各州では接戦が続いており、いずれの州も選挙結果を有利に傾けるには十分です。これらの州のうち、モデルはミシガン州とペンシルベニアを民主党が確実に優勢であると分類しました。残りの州はすべてモデルの誤差範囲内であったため、接戦と分類されました。
この分析がどのように機能するかを視覚的に理解できるように、一般的に激戦州とみなされる州の予測因子のいくつかを以下に詳しく説明します。
国内移住率: 2019-2023*
全体的に、純移民率と民主党の勝利の差には負の相関関係がある。過去4年間、多くの青い州では人口が減少しているが、赤い州では人口が減少している。 州は獲得したこれらの激戦州のうち、知事や州政府に関しては「赤」の州もあれば、「青」の州もあります。全体的に見ると、ペンシルベニア州とミシガン州は、過去 2 年間で移住率がマイナスだった唯一の 4 州です。
郵送投票の請求
カリフォルニア、コロラド、ネバダなどの一部の州は「全郵送」州です。つまり、登録有権者全員にデフォルトで紙の投票用紙が送られます。ユタ州 (およびおそらくネバダ州) を除き、これらの州のほとんどは民主党支持の州であり、完全に民主党支持です。ネバダ州は、全郵送州である唯一の激戦州で、そのリクエスト数は横ばいであることがわかります。アリゾナ州を除く他のほとんどの州では、郵送投票のリクエスト数が減少するのが一般的な傾向です。
年間の新型コロナウイルスワクチン接種率**
このモデルは年間のコロナワクチン接種率を基準としているため、 強いプレディクタ 民主党の支持率は高いが、全体的な人気は低下しているため、モデルでは相対スコアを使用して、年内の各州を比較しています。ウィスコンシン州を除く残りの州では、19年**、2021年、2022年の新型コロナウイルスワクチン接種率が平均をわずかに下回りました。
*国内移住率は前年と一致しています。
**新型コロナウイルスワクチンは19年まで入手できなかったため、2021年のデータは2021年の選挙結果データと組み合わせられました。2020年と2022年については、その年の新バージョンの接種率を反映したデータとなっています。
予測因子がモデルにとってどれほど重要かを知るために、以下のグラフは、各指標がモデルの予測にどの程度影響するかをランク付けしています。ご覧のとおり、新型コロナウイルスのワクチン接種率は「前回の民主党の勝利」のすぐ下にランク付けされています。
結果
このモデルでは、ハリス氏が民主党が確実に勝利すると予測される州で260の選挙人票を確実に獲得するとしている。ペンシルバニア州とミシガン州が実際に争点になっている場合、そのうち民主党が確実に勝利するのは226票のみとなる。
このモデルは、共和党が確実に勝利すると予測される州でトランプ氏が219票の選挙人票を安全に獲得すると予測している。
激戦州であるウィスコンシン、ジョージア、ノースカロライナ、ネバダ、アリゾナの各州はいずれも争点となっており、59 票の選挙人票を獲得している。ペンシルベニアとミシガンも加われば、争点となる選挙人票は 93 票となる。
ハリスの勝利への道
ハリス氏の勝利への道は、一見簡単そうに見える。選挙人獲得数が「手中に収めている」ため、ハリス氏は激戦州をいくつか獲得できる。モデルではペンシルバニア州とミシガン州がハリス氏の勝利として示されているが、もしハリス氏がこれらを制覇すれば、アリゾナ州、ノースカロライナ州、ウィスコンシン州、ジョージア州のいずれか1州で勝利すれば勝利は確実だ。ペンシルバニア州かミシガン州のいずれかで勝利すれば、ハリス氏はその敗北分を2~XNUMX州の激戦州で補う必要がある。
トランプ氏の勝利への道
「何が起きてもおかしくない」という心構えでトランプ氏の進路を見ることが重要だ。同氏は過去2回の選挙で予想を上回る成績を収めた。ほとんどの情報ゲートキーパー、主流の評論家、選挙世論調査員は過去に誤った予測を立ててきた。
219州で勝利を収めたトランプ氏は、アリゾナ、ジョージア、ノースカロライナ、ウィスコンシン、ネバダの接戦州をすべて制さなければならない。ペンシルベニアとミシガン、あるいはその両方で勝利すれば、トランプ氏の道のりは楽になるが、それは残りの接戦州のうち2、3州で勝利する必要があることを意味する。
下のダッシュボードをご覧ください。操作して、接戦の州でどちらの候補者が勝利するかを確認し、州別に測定された予測の散布図を確認します。
モデルに基づく私の個人的な予測
私はノースカロライナ州とジョージア州で過ごしているので、これらの州についてはより直感的に理解しており、トランプが勝つと予想しています。アリゾナ州、ネバダ州、ウィスコンシン州についてはその直感がありません。ですから、この予測は鵜呑みにしないでください。しかし、この方法に忠実に、私のモデルはペンシルベニア州とミシガン州をハリスが勝つと予想しており、ハリスが少なくとも 2、3 の激戦州で勝利すると考えています。私は間違っていることを願っています。
参照:
MIT選挙研究所 https://electionlab.mit.edu/data#data
米国の事実 https://usafacts.org/economy/
UF 選挙ラボ https://election.lab.ufl.edu/voter-turnout/
2022 年 XNUMX 月の選挙における投票と登録 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
と組み合わせた、シンプルで高性能なLC / MSシステム https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
ファイブサーティエイト https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
KFFワクチンモニター https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
UF 選挙ラボ https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
国立健康統計センター https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf 国勢調査政府 https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
国立健康統計センター https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
国勢調査 - 貧困 https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
国勢調査 - 州別の人口変化 https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
米国選挙プロジェクト https://electproject.github.io/
著者からの転載 サブスタック
の下で公開 Creative Commons Attribution4.0国際ライセンス
再版の場合は正規リンクをオリジナルに戻してください。 褐色砂岩研究所 記事と著者。