マーケティング活動などに欠かせないアンケートの主な集計方法には、単純集計(GT表)とクロス集計の2種類があります。この記事では、単純集計とクロス集計の表の見方や使い方についてそれぞれ説明し、クロス集計の種類・利用する際の注意点についてご紹介します。
クロス集計とは?
クロス集計は、アンケートの回答データを細分化して把握できる集計方法で、あらゆる分野の統計調査で盛んに用いられています。クロス集計に対する理解をより深めるため、まずは単純集計の特徴から説明します。
■単純集計(GT表)
単純集計は「GT(Ground Total)表」とも呼ばれている手法です。アンケートの回答者全体を母数とし、それぞれの設問に対する回答数、回答率などを明確に把握できます。単純集計はすべてのデータ集計のベースとなるもので、最もシンプルでわかりやすい統計表です。どんなアンケートも、まずは単純集計の結果に目を通してから分析をする必要があります。
下の図は、職業を聞く設問において、アンケート回答者全体(357サンプル)の選択した項目の内訳を表しています。「n」は抽出した標本の大きさ(=回答者数)を表しています
.jpg?width=402&height=242&name=%E5%8D%98%E7%B4%94%E9%9B%86%E8%A8%88(GT%E8%A1%A8).jpg)
■クロス集計
クロス集計は、回答者の、性別・年齢などといった属性や、複数の設問に対する回答データを掛け合わせて(クロスして)集計する手法です。単純集計よりも細分化されたデータを得ることが出来ます。
下の図は、前段で取り上げた、職業を聞く設問の回答結果を、回答者の属性を掛け合わせてクロス集計で表したものです。

クロス集計表の見方
クロス集計の回答データを正しく読み取って分析するためには、チェックするべきポイントを知っておかなければなりません。クロス集計表の左側にある、回答者の属性を分類した縦軸は「表側(ひょうそく)」、表の上部に位置する横軸の部分は「表頭(ひょうとう)」と呼ばれています。
表側には、掛け合わせる(クロスする)属性/設問の項目が、表頭には掛け合わせる先の設問の選択肢がそれぞれきます。

また、表側は「分析軸」などと表記されることもあり、「どのような属性の視点で調査結果を分析したいか」を決める大事なポイントです。
これに対し表頭は「どのような結果を知りたいか」に関わってきます。クロス集計の回答データの因果関係を分析する場合、表側は「原因」、表頭は「結果」として捉えられるというわけです。
言い換えれば、回答データに隠された本質的な事象の意味をどこまで深く探れるかは、「この設問は、どの属性または設問を掛け合わせて分析すれば良いか」という点が非常に重要になってきます。
ネオマーケティングでは、様々なトピックで調査レポートをリリースしています。
ダウンロードいただいた方にGT表、クロス集計表をお渡ししていますので、参考までにぜひご覧くださいませ。

クロス集計の種類
クロス集計は、掛け合わせる対象や数によって、3つに分類することができます。
■属性クロス集計
属性クロス集計は、回答者の年齢、性別、職業、居住地、家族構成、年収など(=属性)といった、回答者の基本情報・プロフィールを掛け合わせたものを指します。
たとえば、「この年齢層の男性はどういう職業に就いている人が多いのか」「20代の女性は他の年齢層よりこの商品・サービスの利用頻度が高い」といったように、回答者の属性毎に回答数を調べることが可能です。

■設問間クロス集計
設問間クロス集計は、回答者属性以外の設問の回答データを掛け合わせて比較する手法です。単体の設問だけでは結果を分析しにくい場合でも、複数の設問の回答をクロスさせることで、設問間の因果関係が見えてきます。
下図は、「Q3:プラントベースフードの実践理由」を聴取する設問を「Q1:職業」の設問にかけ合わせています。

設問と設問を掛け合わせて集計することで、「●●と考える人は、■■の傾向にある」といった分析をすることができます。
(そもそも、職業とプラントベースフードを実践している理由は関連性が薄いので、クロス集計をかける必要性がないのですが、あくまでも例なのでご容赦いただけますと幸いです)
■多重クロス集計
多重クロス集計とは、3つ以上の設問の回答データを掛け合わせる手法です。掛け合わせる設問が3つの場合は「3重クロス集計」、4つなら「4重クロス集計」といいます。
下図は、回答者の属性である「年代」「性別」と、「Q3:プラントベースフードの実践理由」の3つのデータを「Q1:職業」に掛け合わせた例です。

多重クロス集計の注意点としては、掛け合わせた項目毎の母数が、属性クロス集計と設問間クロス集計と比較して少なくなることです。掛け合わせる設問数が多くなるほど、各項目の回答者の母数は減ってしまうため、アンケートの精度が損なわれてしまいかねないのです。(精度が損なわれる理由は後述)
そのため、多重クロス集計を実施する際は、サンプルサイズの確保に注意する必要があります。多重クロス集計は、アンケートの回答者の母数を十分に確保できている場合に限って信頼性を発揮します。
クロス集計を行う際の注意点
クロス集計を用いることで多角的な視点から情報を分析できますが、行う上で注意点があります。ここでは、特に注意したい点を3つ紹介します。
①アンケート設計の段階でクロス集計を想定する
1つ目は、「調査設計の段階で予めクロス集計を想定する」という点です。
そもそも適切な設問が存在していなければ有意義な分析をすることができません。そのような事態を防ぐためにも、調査の設計段階から「何を知りたいのか」という課題を明確にしておく必要があります。そのうえで、「どのような集計軸を組んだら分析が可能か」という点を検討しましょう。
たとえば、「商品Aを買った人の割合は年収が高いほど多い」という仮説を立てたとします。しかし、年収の属性や購買経験の有無を確かめる設問を記載していなければ、裏付けようがないのです。アンケート結果を回収した後に気づいたとしても手遅れなので、価値のある回答データを獲得できるかどうかは事前の準備にかかっています。
②クロス集計後の、項目毎のサンプルサイズに注意する
2つ目は、「クロス集計後のサンプルサイズが僅少にならないようにする」という点です。一般的に定量調査は、1つの属性につき最低30のサンプルサイズがなければ信頼性に欠けると言われています。、クロス集計を行い回答者を細分化したが故に、30未満に満たない項目が発生するケースが少なくありません。このようにならないために、前述した「どのような集計軸を組んだら分析が可能か」を決定した後「アンケート回答者数はどのくらい必要なのか」ということを前もって計算しておきましょう。
③分析軸(表側)を必要以上に多くしない
詳細なデータを取得することはもちろん重要なことですが、設問によっては、クロス集計を行ったが故にデータがわかりづらくなる場合があります。
これまでご紹介したように、クロス集計は単純集計がベースにあります。まずは単純集計で全体像を把握し、そのうえでクロス集計で詳細を分析するという流れが重要です。
1つ目の注意点と同様に、アンケート設計の段階から仮説を立て、クロス集計をかける設問を予めて決めて、無闇にデータを複雑化しないように注意しましょう。。
「とりあえずデータを細分化したら何か分かるかもしれない」という安易な考えてクロス集計を行うのは非常に危険です。
しかし、調査の上で必要なクロス集計を行った結果、表側や表頭が多くなり、それぞれの項目を比較しづらくなる場合があります。その際には、クロス集計表を2次元マップに変換する「コレスポンデンス分析」という手法がありますので、ぜひご活用ください。
-

-
この記事では、コレスポンデンス分析の手順、メリット・デメリット、実施するための調査設計について紹介しています。クロス集計の分析結果を可視化する分析手法ですので、ぜひご覧ください。
まとめ
これまで、単純集計とクロス集計についてそれぞれ紹介しました。
単純集計は、回答者の全体的な傾向をつかみやすいのが特徴で、「多いか少ないか」「増えたか減ったか」などの結果をスピーディーに、且つダイレクトに受け取ることが可能です。
対してクロス集計は、回答者の属性や、他の設問と掛け合わせることでより細かい分析をすることが可能です。
例えば、ユーザー、非ユーザーという集計軸で掛け合わせた場合、商品・サービスに対するユーザー/非ユーザーが持つイメージの違いや、非ユーザーにとってネックとなっているポイントなどを洗い出すことが可能です。それらのデータを基に、ユーザーの持つイメージを守りつつ、非ユーザーのユーザー化に向けた施策を検討することができるでしょう。
このように、マーケティング施策を具体的に検討する材料として、クロス集計は非常に有効です。
クロス集計を想定したアンケート設計を適切に行い、価値のあるデータを収集できるように心がけていきましょう。
ネオマーケティングでは、お客様の課題や目的に沿ったアンケート設計を行っています。
その際に、求める情報を収集するための集計軸などもご提案しております。
調査を検討されているが、アンケートの設計や分析に不安を感じる方は、ぜひ1度お問い合わせください。