一人一人の行動を把握することなく、どうやって消費者の行動を正確に測定することができるのだろうかと疑問に思ったことはないだろうか。もしそうなら、あなただけではありません。実際、ニールセンについて 、このトピックに関する質問をよく目にする。結局のところ、米国には3億2,500万人以上の人々が住んでいるため、国民一人一人に確認することなくメディアへの関与や買い物習慣を測定する当社の能力(ニールセンについて )に懐疑的な人がいるのは理解できる。
多くの理由から、できるだけ多くの人と関わって消費者の行動を測定しようとするのは現実的ではないし、必ずしも良いアイデアとは言えない。また、単に実現不可能な場合もある。一部の人々は、自らの選択であれ、状況であれ、測定から外れることを選択する。その結果、最も参加しやすいグループだけに焦点を当てたデータに歪みが生じる可能性がある。
人々は、個人レベルの測定に不可欠であり、より多くの人々を代表するように選択された主要な 人々から成るパネルは、より大きな集団の行動に対するインサイト を提供することができる。しかし、パネルに含まれる人数が、測定対象となる大規模なグループよりもはるかに少ない場合、具体的にどのようにすればそれが可能なのだろうか。
当社のパネルは、真の消費者行動に関する個人レベルのデータ(インサイト )を提供するた め、パネルや調査を通じて測定した母集団が、より大きな母集団を正確に表していることを確認するため に、厳格なデータ・サイエンスと統計的サンプリング手法を使用しています。一般に、サンプリングとは、ある母集団を測定する統計的な手段であり、より大きな母集団を表現するために、測定値を正確に拡張することを意図しています。しかし、測定と同じように、すべてのサンプリング方法が同じように作られているわけではありません。
サンプリング方法は通常、確率ベースと非確率ベースの2つのカテゴリーのいずれかに分類される。確率に基づくサンプリングでは、母集団のすべての人が同じ確率で選ばれます。非確率サンプリングでは、選ばれる確率が高い人も低い人もいます。ですから、均等な代表を確保するためには、ある種の確率に基づくサンプリングを使用しなければなりません。
しかし、サンプリングには、この2つの異なる方法のどちらかを選ぶ以上のものがある。具体的には、サンプリングのプロセスは、複雑さと実行において様々である。別の言い方をすれば、サンプルを実施するためのパラメータはかなり一般的であり、与えられたサンプルの完全性は、それがどれだけ徹底的に準備されたかに依存する。無線測定では、ポータブル・ピープル・メーター(PPM)とオーディオ・ダイアリー測定サービスの原動力となる100以上の重要なプロセスを適用しています。ニールセンが可能な限り代表的なサンプルを作成できるよう、これらのプロセスを日、週、月、四半期、年単位で実施しています。
では、全体的なプロセスはどのようなものだろうか。まず、米国国勢調査のデータを活用し、測定対象者の人口統計学的構成(年齢、性別、人種、民族、言語嗜好など)と地理的構成を推定します。過去のデータと予測モデルに基づいて、無作為に抽出した世帯の人口構成とその世帯が参加する可能性を予測します。これらのモデルは、細かい地理的レベル(教区、市、郡など)で実行され、代表的なサンプルを維持するためにこれらのモデルを常に監視し、必要に応じて更新を行います。
ニールセンでは、パネルに登録する世帯を募集する際、ニールセン全体でさまざまな方法を用います。例えばラジオ測定では、測定エリア内の潜在的なパネリストの主な連絡先を特定するために、サンプルベンダーと連絡を取ります。これがスタートサンプルとなります。開始サンプルの連絡先情報を保存した後、ニールセンのチームはサンプルの選択プロセスを開始し、最終的に様々な下流のリクルート作業(例:リクルート資料の郵送、電話インタビューの実施、会員担当者の家庭訪問など)を促します。
全過程において、ある世帯がパネルや調査に参加する機会を与えられるかどうかを決定する 要因は数多くある。これらの要素は、私たちが測定する人口の代表サンプルを達成する能力に直接関係しています。
テクノロジー、クッキー、リターン・パス・データ、「いいね!」、プレイリスト・アルゴリズム、その他無数のデジタル・マーカーが、私たちのオンライン生活のどこにでも「足跡」を残す世界に私たちが生きているのは事実だ。しかし、そのデータの多くは完全ではない。データの多くはバイアスを含んでいる。データの多くは、測定に使用されることを意図していない。しかし、個人レベルの情報は、真の計測のための決定的なソースであり続ける。そして、サンプリングは、個人レベルの代表的な測定を解き放つ鍵である。