CivicTech & GovTech Advent Calendar 2025に投稿させてもらいました

CivicTech & GovTech - Qiita Advent Calendar 2025 - Qiita

政策は難しいから,数字でみてしまおう

選挙のたびに公約や政策が話題になりますが、正直なところ、内容を比較して理解するのは簡単ではありません。小選挙区であれば個々の候補者の印象が判断材料になることもありますが、比例代表ではそうした情報が見えにくくなります。そこで政党や候補者について直感的に把握するための一つの切り口として、「候補者の年齢」を眺めてみることをはじめました。

平均年齢はあっても、分布がない

政党別の候補者年齢について調べてみると、平均年齢は新聞社やテレビ局のサイトで簡単に見つかります。しかし、実際に知りたかったのは「どの年齢がどれだけいるのか」という分布でした。平均値だけでは、最年少や最高齢、世代の偏りといった重要な情報が隠れてしまいます。

civic techの壁は「集めること」

「じゃあ自分で集めよう」と思ってぶつかったのが、データが一元化されていないという問題でした。候補者情報は選挙区ごとに管理されており、一次情報を横断的に取得するのは意外と大変です。今回は、候補者情報が比較的構造化されており集計しやすかったNHKの選挙特設サイトから情報を収集することにしました。

ヒストグラムは便利だが、誤解も生みやすい

集めた年齢データをまずは素直に可視化しようとすると、真っ先に思いつくのはヒストグラムです。分布を把握するには十分便利な手法ですが、bin幅の取り方次第で印象が大きく変わり結果の解釈に影響する可能性の問題があります。

さらに、政治に関するデータを公開するとなると、「恣意的ではないか」という指摘はできるだけ避けたい、という気持ちもありました。

ヒストグラム × ドットプロットの折衷案

分布の全体像と個々の候補者の情報を同時に伝えるために、ヒストグラムにドットプロットを組み合わせることにしました。各ドットは実際の候補者の年齢を表し、最年少や最高齢が直感的に把握できます。集計結果と生データを同時に見せることで、恣意性を抑えた可視化を目指しました。

実際には、政党ごとに年齢分布を並べ、ヒストグラムの上に個々の候補者年齢をドットとして重ねています。各ドットが一人の候補者に対応しており、分布と個別データを同時に確認できるようにしました。

plot.png

このようにしてみると、平均年齢だけでは見えなかった政党内のばらつきや、特定の年代に候補者が集中している様子が直感的に分かります。また、最年少・最高齢の候補者も一目で確認できます。