本コンテンツへスキップ
02_Elements/Icons/ArrowLeft 戻るインサイト
インサイト>メディア

進化するメディア環境の中で、機械学習による将来のテレビ視聴率予測

5分で読めるシリーズ|ニールセン VP 崔靖松、データサイエンスマネージャー スコット・セレデー|2016年10月号

メディア企業や広告主は、テレビ番組の成功度を測るため、メディア購入のターゲットに対して視聴者のサイズや構成が適切かどうかを確認するため、そして数字が足りなかった場合の埋め合わせのために、日々テレビ視聴率に頼っています。このような観点から、テレビ視聴率はテレビ視聴の過去、あるいはせいぜい現在を測定する指標であると言えます。

しかし、メディア企業は未来を予測するために視聴率を利用しています。視聴率は期待値を設定し、あるシーズンから次のシーズンへの番組編成の決定に影響を与えます。また、視聴率は、実際に放送される時期よりもかなり前に広告料金を設定するのに役立ちます。例えば米国では、テレビ局が年に一度(3月から5月)開催する「アップフロント」と呼ばれるイベントで、そのシーズンの広告在庫の大半を販売します。つまり、あなたが今テレビで見ている広告のレートは、1年以上前に交渉されたものかもしれないのです。

3ヶ月後、6ヶ月後、12ヶ月後の番組の視聴率を予測するために、研究者は予測モデルを使用しています。これらのモデルの多くは、ほとんどあるいは全く修正することなく、何年も使われてきました。これらのモデルは視聴率の予測に成功し、毎年何十億ドルもの広告費のやり取りを支える素晴らしい仕事をしてきました。しかし、テレビのエコシステムの急速な変化により、信頼できるモデルの開発がますます困難になってきています。

メディア業界における最近の技術革新について考えてみましょう。Netflix や Amazon Prime のようなストリーミング・サービスが大量に導入され、新しいテレビ接続デバイスが大画面での視聴体験を再構築しています。人々は、タイムシフト、ストリーミング、ビンジ・ウォッチなど、消費するメディアをこれまで以上にコントロールしているのです。彼らの行動はより複雑になっているだけでなく、より予測不可能になっています。

Nielsenでは、人々がどのようにメディアを消費するかを測定する多くのデータリソースにアクセスすることができます。デジタルTVのデータを予測モデルの入力・出力に加える前に、まず、従来のTVのデータを唯一のソースとして、従来のTVの視聴率予測方法を改善することが可能かどうかを検証したいと思いました。Nielsen National People Meterのおかげで、私たちは何年も前から、一貫した方法論と全国的に代表的な視聴者の強固なパネルによる高品質のデータを手に入れることができました。

私たちは、この豊富なデータを非常に詳細なレベルで活用し、新しい予測モデルを作成しました。過去のLive+7視聴率(つまり、ライブ視聴者と初回放送から7日後までの視聴者を含む視聴率)、C3視聴率(再生を含むCM視聴率)などの変数。過去のLive+7視聴率(ライブ視聴者と初回放送から7日後までの視聴者を含む視聴率)、C3視聴率(3日後までの再生を含む商業視聴率)、HUT(任意の時点でテレビを使用している世帯の割合)、リーチ、世帯視聴率、デモグラフィック視聴率、曜日、時間、ネットワークのアイデンティティなどの変数は、入力変数として使用した主要情報の一部で、関連データの関係を特定するために高度機械学習や統計アルゴリズム(リッジ回帰、ランダムフォレスト、グラジエントブーストなど)を活用したのです。

クライアントと協力して、作成したモデルのテストと検証を行うため、多くの概念実証試験を実施しました。私たちは、将来の視聴率を粒度の細かいレベル(2~5歳の男性や65歳以上の女性など、小さなデモグラフィック・グループの時間ブロック)で予測するモデルを設計しましたが、その数字をネットワーク・レベルまでロールアップすることも行いました。私たちのモデルが現実に対してどのように作用するかを理解するために、2四半期のホールドアウト期間を使って、私たちの予測およびクライアントの内部予測と実際の視聴率データを比較しました。例えば、我々は2014年第1四半期までの過去データのみに基づいて、2015年第2四半期にネットワークAで火曜日の午後9時から午後10時の間に30~34歳の人のLive+7平均視聴率を1.94と正確に予測しました。予測は、ネットワークレベルではR2乗(分散を説明する割合)が99%と非常に正確でしたが、より細かい時間ブロックのデイパートレベルや、一部の小さなデモグラフィック・グループについては、より困難でした。しかし、1時間単位でもR2乗は95%を超え、クライアントがそれまで使っていたモデルを大きく上回りました。2,000を超える日中の予測において、予測精度の2つの重要な指標であるR2乗の精度は41%、加重絶対誤差(WAPE)の精度は16%、当社の予測が上回っています。

ニールセンについて これらの概念実証モデルや実施したテストの詳細については、近日公開の論文でご紹介します。このプロジェクトの重要な成果は、大きくてノイズの多い行動データを予測的なモデリング機能に変換し、それを非常に効率的(かつ自動的)な方法で行えたことです。しかし、視聴率の小数点以下は莫大な財務的影響を及ぼすため、新しい入力変数(広告費や番組固有のデータなど)の追加、番組パッケージやチャンネルラインナップの変更に迅速に対応する方法の構築、新しい形式の回帰および分類アルゴリズムのテスト、あるいは複数の有望なモデルを1つにまとめるなど、限界への挑戦を続ける必要があるのです。

このプロジェクトでは従来のテレビに焦点を当てましたが、デジタルデータの影響が過去のデータにおけるテレビ視聴率の変化に反映されていることは興味深いことであり、したがって私たちの予測にも反映されています。しかし、これは累積的な効果の間接的な測定であり、例えば、オーバー・ザ・トップ視聴やスマートフォンのアプリでの視聴に特化したモデルの代用にはなりえません。以上のような次のステップに加えて、デジタルデータの活用は、今後の予測を改善するための重要な要素になると思われます。

最終的には、それぞれのクライアントが自社のプログラムについて深い知識を持っており、また、それらのプログラムが将来どのように受け入れられるかについて強い直感を持っていることを認識する必要があります(ニールセンについて )。予測モデルを構築する際、この「人的要素」を無視してはなりません。特に、市場における重大かつ予期せぬ変化に対応する際には、その価値が発揮されるでしょう。豊富なデータ、強力な機械学習アルゴリズム、そして分野の専門知識を統合したシステムは、どちらかが単独で達成できるよりも優れた結果を出すことができます。

関連タグ

類似のインサイトを閲覧し続ける