googleは選挙結果を予想できるか?さいたま市長選での検証
選挙結果を事前に予測する可能性のひとつとして、選挙区の市民のウェブ上での検索数やSNSでの発言量などから、選挙結果を予測する方法がある。
ネットでよく検索されたり、SNS上でよく言及されたりする候補者は市民の関心が高いことを反映しているので当選しやすいのではないかというアイデアである。このアイデアは、現在世界中の研究者が検証しているようだ。
ヤフー、検索数のビッグデータから参院選の結果予測 :日本経済新聞
Why Google May Be the New, Better Way to Predict Election Results - The Quint
ここではシンプルに、googleでの検索数と選挙結果の関係を検証する。対象となるのは2017年さいたま市長選挙のデータだ。
さいたま市長選に立候補していたのは、
現職:清水勇人氏 無所属
新人:中森福代氏 無所属
新人:前島英男氏 共産党推薦
の三人である。
候補者の検索数の推移
選挙戦一週目
選挙戦が始まった直後は、清水氏と中森氏が互角か、少し中森氏がリードしていた。
しかし選挙戦2日目になるあたりから、清水氏の検索数が一貫して中森氏を上回っていた。
選挙戦二週目
選挙戦後半も、差はわずかではあるが、現職の清水氏がリードしていた。
その傾向は最終日を迎えても変わらず、若干ではあるが、清水氏リードのまま投票日を迎えている。
一方前島英男氏は、清水氏・中森氏に比べ検索数は非常に少なく、google トレンドに反映されないほどだった。
2週間を通した全体の検索ボリュームを比較すると、清水氏11:中森氏7:前島氏0である。
検索数が予想する投票パターン
ということで、google trendsの結果のみから予測する投票結果は、
定性的な順位は、1位清水氏、2位中森氏、3位前島氏であり、
定量的な得票数は、清水氏が最も多く、中森氏がその6~7割程度、そして前島氏が大きく差を開けられるというものになる。
はたしてこの予測は、どれくらい実際の選挙結果と整合性があるのだろうか。
実際の投票結果
結論から言うと、順位のみの予測はうまく当たっていた。
1位が清水氏、2位が中森氏、3位が前島氏という選挙結果である。
さいたま市長選、現職・清水氏3選 市のPR路線、信任受けた結果に
しかし、定量的な得票数の予測となると、ほとんど当たってないと言えるだろう。
清水氏が20万票以上の大量の得票を集めているのに対して、次点の中森氏は6万3000票あまりと清水氏の30%程度の票しか得られていなかった。
前島氏の得票に関しては、予測と実際の選挙結果がより大きく外れていた。検索数ではほとんどゼロに等しかった前島氏であるが、実際の選挙では53000票あまりと中森氏に近い票を得ていた。
つまり中森氏に関しては得票数を過大推定していたのに対して、清水氏・前島氏に関しては過小推定していたことになる。
なぜ検索数で予測できなかったのか
検索数と投票数に乖離があった原因はなんだろうか。
考えられる理由のひとつは、わざわざ検索をするのは「まだ投票するのを決めていない層」すなわち「無党派層」であることがあるだろう。逆に、投票先を決めている支持者たちはわざわざネットで検索をせずに投票すると考えられる。
この場合、支持層が比較的固まっている現職の候補や、政党の支持・推薦を受けた候補者は、検索数だけで投票数を予測すると過小評価になってしまうだろう。
これが、現職の清水氏と共産党推薦の前島氏の得票数を過小推定してしまっていた理由かもしれない。
また単純に、ネットで検索しない層の投票動向を全く考慮できないことも理由として考えられる。
とはいえ、今回はたった一回の選挙に基づく考察だ。
今後行われる市長選挙でも検索数と得票数の関連を検証し、うまく選挙結果を予測できるようなモデルを構築したい。
関連記事