年齢・性別データが表示されない原因?Google Analyticsにおける「しきい値」の適用とは
アナリスト 上田Webサイトの利用ユーザーの属性を知るために
Google Analyticsでは、Webサイトを利用しているユーザーの属性データ(年齢、性別など)を確認することができます。ターゲットユーザー層の利用状況を把握することは、Webサイトやマーケティング施策の改善にも役立つことでしょう。
しかし、Google Analyticsにおいては、それらのデータから個人の身元を推測できないようにするためのシステムが組まれています。この記事では、Google Analyticsの「しきい値」とユーザーの属性データの扱いについて解説します。
Google Analyticsにおける「しきい値」とは
ユーザーの年齢や性別に関するレポートは、利用ユーザーの行動傾向や関心をあぶりだすことのできる分析トピックの1つです。しかし、その母数が少ない場合、個人の識別を助長してしまう可能性もあります。
そのような、個人の識別を防ぐために、適用されることがあるのが「しきい値」です。「しきい値」が適用されると、該当となるデータ行がレポートから除外され、データの一部が表示されなくなることがあります。
なお、「しきい値」はGoogle Analytics側のシステムによって定義されているため、利用者側でこれを調整することはできません。
「しきい値」が適用されるレポートの条件
「しきい値」が適用されるレポートの条件は、以下の通りです。
ユニバーサル アナリティクス(UAからはじまるトラッキングIDのプロパティ)の場合
アナリティクス ヘルプ(ユーザー属性とインタレスト カテゴリについて > データのしきい値)の内容には、このように記載されています。
(プライマリまたはセカンダリのディメンションとして、あるいは適用済みセグメントの一部として)年齢、性別、またはインタレスト カテゴリがレポートに含まれている場合、しきい値が適用され、データの一部がレポートから除外されることがあります。
たとえば、レポートに含まれる「性別 = 男性」のユーザーが一定数未満の場合に、男性のデータが除外されることがあります。
GA4(Google アナリティクス 4プロパティ)の場合
アナリティクス ヘルプ([GA4] データしきい値)の内容には、このように記載されています。
レポートまたは分析にユーザー属性情報(年齢、性別、インタレスト カテゴリなど)が含まれており、かつレポート ID がデバイス ID にもとづいている場合において、個別ユーザーの識別を防ぐのに十分なユーザー数に達していなければ、該当データを含む行が除外されることがあります。
たとえば、レポートの「性別 = 男性」の事例が一定数以下の場合に、男性のデータが除外されることがあります。
いずれにせよ、レポートに年齢や性別、インタレスト カテゴリといった属性データが含まれている、かつ、ユーザー数が一定数以下と少ない場合に、適用される可能性が高いようです。
「しきい値」の適用有無を確認する方法
ユニバーサル アナリティクス(UAからはじまるトラッキングIDのプロパティ)の場合
レポートタイトル右横のチェックマークにカーソルを合わせると、サンプリング状況と精度を選択することができます。しきい値が適用されていると、それにあわせて、お知らせが表示されます。
GA4プロパティの場合
「しきい値」が適用されているかどうかは、ユニバーサル アナリティクスと同じく、レポート画面より確認することができます。レポート上部に、サンプリングの有無を示すデータ インジケーター(パーセンテージ記号のアイコン)があります。
このデータ インジケーターにカーソルを合わせた時、しきい値が適用されていると、その旨がお知らせとして表示されます。
以上のように、年齢や性別、インタレスト カテゴリを参照する際には、イレギュラーが適用され、不完全なデータが抽出されることがあります。
表示されるはずのデータが表示されない、という時にも「しきい値」の適用を疑ってみてください。