🌙 ダーク
第2回 データで読むホンネ

このサイトに集まるのは、誰なのか。
男女比と年齢層を数字で読む。

回答やコメントといった「活動のある」ユーザーに絞ると、何が見えてくるのか。流入元の統計と比較しながら、このサイトの母集団の輪郭を描いてみた。

01

性別を選んだ人の3人に1人が女性。
しかし回答者になると4割に近づく。

このサイトは最初に男女どちらかを選んでから使う仕組みになっている。その全選択者を集計すると、女性34%・男性66%という分布だった。なお以降の分析はこの自己申告値をそのまま用いる。男女比の信頼性については最後にまとめて論じる。

性別選択者の男女比(全体)
性別選択者全員を集計

ところが「実際に回答した」ユーザーに絞ると、女性40%・男性60%へと比率が変わる。性別を選んだだけで終わった層を除くと、女性比率が約6ポイント上昇する。

回答者の男女比(活動ユーザーのみ)
1件以上回答したユーザーを集計

申告上の女性ユーザーは、性別を選んだ後に実際に回答まで行動する割合が男性より高い。男性の場合、流入元の画像チャットから来てサイトを眺め、そのまま離脱するケースが相対的に多い可能性がある。対して女性(申告)は、このサイトのテーマに何らかの引力を感じて、実際に答えるところまで踏み込む——そういう層が多いのかもしれない。

なお集計はCookieを単位としているため、同一人物が複数のセッションを持つケースを完全には排除できない。以降の数字はすべて割合として読んでほしい。

02

コメント投稿者は、男女ほぼ半々。

コメントを投稿したユニークユーザーで見ると、申告上の女性101・男性100とほぼ半々だった。回答者における女性(申告)40%という比率より、コメント参加者の女性比率は高い。

回答は選択肢を選ぶだけだが、コメントはテキストを書く行為だ。より能動的な関与が必要にもかかわらず、女性の参加比率が回答時より上がるというのは興味深い。少なくとも申告上は、匿名という条件が整ったとき女性が「答える」だけでなく「語る」ことにも積極的になる——そう読むことができる。

コメント投稿者の男女比(ユニーク投稿者)
削除済みコメントを除く・アクティブコメントのみ集計
03

女性の57%が10〜20代。
男性は30〜40代が中心。

年代を尋ねる質問への回答から、ユーザーの年齢層を推計した。男女で分布がまったく異なる。

年齢層の分布(回答者・男女別)
年代入力のある回答者を集計

女性は10代18%・20代39%で、合わせると57%が20代以下だ。最多は20代で、若年層に集中した正規分布型になっている。対して男性は30代32%・40代24%が中心で、10代+20代は合計26%にとどまる。50代以上も18%と、女性(3%)と比べて大きく差が開く。

ここで一つ、参照できるデータがある。このサイトの流入元である画像チャットで、2016年5月に独自アンケートを実施したことがある。約500件の回答を得たそのデータには、年齢分布が含まれていた。

年齢分布の比較:2016年アンケート vs ホンネ調査(男性)

2016年アンケート:男性374件 / ホンネ調査:年代入力のある男性回答者

年齢分布の比較:2016年アンケート vs ホンネ調査(女性)

2016年アンケート:女性123件 / ホンネ調査:年代入力のある女性回答者

約10年前のデータだが、傾向は現在のホンネ調査と驚くほど一致している。女性は18〜20代が63%と若年層に集中し、50代以上はゼロ。男性は40代が最多(36%)で年齢層が幅広い。流入元ユーザー自体がもともとこういう年齢分布を持っており、それがホンネ調査にも持ち込まれている——と見るのが自然だろう。言い換えると、ホンネ調査の年齢分布はサイト固有の偏りではなく、母集団の特性を忠実に反映している可能性が高い。

年代は自己申告であり、また年代を尋ねる質問に回答したユーザーのみが集計対象となる点に留意が必要だ。2016年アンケートは画像チャット上で実施したもので、ホンネ調査とは異なる母集団による回答である。

04

流入元の女性比率は16%。
なぜこのサイトでは34%になるのか。

まず前提として、この16%という数字はGoogle Analyticsによる過去の解析で得られたものだ——Cookieの許可が不要だった時代の、信頼性の高いデータである。現在はCookieの同意が必要な仕様となっているため最新値は不明だが、ここでは正として扱う。

次に流入経路の問題がある。このサイトへのリンクは画像チャット全体に貼られているわけではなく、主に掲示板やオープンチャットに設置している。画像チャット全体の女性比率が16%だとしても、掲示板やオープンチャットを利用している層の女性比率はそれより高い可能性がある。特にオープンチャットは自己申告ながら女性比率が高いとされており、そこからの流入が集計に影響している可能性は十分にある。つまり、比較の基準となる「母集団の女性比率」がそもそも16%より高いかもしれない。

もう一点、性別選択は変更できない仕様だが、実際とは異なる性別を選んでいるユーザーが一定数いる可能性も否定できない。この点については最後にまとめて論じる。

年齢層についてはGoogleアナリティクスのデータと比較できる。GAの年齢区分(18〜24・25〜34・35〜44)はこのサイトの区分と完全には一致しないが、傾向として見ると——流入元では男性の18〜34歳が46%、女性の18〜34歳が61%であり、女性の方が若い層に偏るとされている。このサイトでも女性の10〜20代が57%・男性が26%と、同じ方向性の傾向が出ている。Googleの信頼性の高いデータと方向が一致することは、このサイトの年齢分布の一定の妥当性を示していると言えるかもしれない。

数字が描いた、このサイトにいる人の像。

性別選択者の34%が女性(申告)で、回答まで行動した層では40%に上がる。コメント投稿者は人数で見れば男女半々。年齢層は女性が若年寄りで、男性は30〜40代が厚い。

年齢層については、複数の根拠が方向を一致させている。2016年の独自アンケート、Googleアナリティクスのデータ、そして今回のホンネ調査——三者ともに「女性は若く、男性は幅広い」という同じ傾向を示している。年齢分布はおおむね実態を反映していると考えてよいだろう。

一方、男女比については慎重に読む必要がある。掲示板やオープンチャット経由の流入では、画像チャット全体の女性比率(16%)より女性が多い可能性は残る。ただそれを差し引いても、登録女性比率34%という数字は流入元の2倍以上だ。このサイトの性別登録は自己申告であり変更できない仕様だが、実際の性別とは異なる申告をしているユーザーが一定数存在するとみるのが自然だろう。その比率がどの程度かは測定できないが、流入元との乖離の大きさを考えると、決して無視できない水準である可能性がある。

つまり、このサイトの回答データを読むとき——特に女性の回答として集計されたデータを解釈するとき——には、その一部が実際とは異なる性別申告によるものである可能性を頭に置いておく必要がある。

誰が答えているかを知ることは、何が答えられているかを正しく読むために、欠かせない前提だ。

あなたのホンネも、答えてみませんか →

本記事はホンネ調査の回答・コメントデータを集計・分析したものです。集計はCookieを識別単位としており、同一人物が複数のセッションを持つ場合は重複して計上される可能性があります。年代データは年代を尋ねる質問に回答したユーザーのみを対象としています。性別・年代はすべて自己申告です。