Zum Inhalt
02_Elemente/Icons/PfeilLinks Zurück zu Einblicke
Einblicke > Zielgruppen

Künstliche Intelligenz ist das Bindeglied zwischen Big Data und Messungen auf Personenebene

4 Minuten lesen | Mainak Mazumdar, Chief Data and Research Officer, Nielsen Global Media | Oktober 2019

Die Wahrheit bei Messungen war noch nie so wichtig wie heute. Deshalb ist die Wahrheit unser einziges Ziel. Aber es war noch nie so kompliziert, zu dieser Wahrheit zu gelangen. Während viele Big Data als Allheilmittel für Messungen in einer digital geprägten Welt ansehen, wissen wir, dass es nicht so einfach ist.

Die Nielsen-Panels bilden seit Jahrzehnten die Grundlage für die Messung auf Personenebene, und das ist auch heute noch so. Das Wachstum von Big Data kann jedoch als Quelle wertvoller Informationen nicht ignoriert werden. Big Data allein ist jedoch nicht für repräsentative Messungen geeignet. Denken Sie nur daran, wann Sie den Kanal an Ihrem Fernseher wechseln. Dieser Wechsel wird Teil von Big Data, aber es gibt keine Aufzeichnungen darüber, wer den Wechsel vorgenommen oder wer ihn beobachtet hat.

Um die Unzulänglichkeiten von Big Data aus einer Messperspektive zu verdeutlichen, haben wir Anfang des Jahres in den USA eine Analyse durchgeführt, bei der wir Set-Top-Box-Daten mit Set-Top-Box-Daten verglichen haben, die wir mit Nielsen-Panel-Daten kalibriert haben. Die Analyse ergab, dass die unkalibrierten Daten von Natur aus verzerrt sind und Minderheiten unterrepräsentieren.

Das soll jedoch nicht heißen, dass Big Data keinen Wert hat. Ganz im Gegenteil. Aber sie müssen sich auf eine grundlegende Wahrheit stützen. Hier kommen unsere Panels und künstliche Intelligenz (KI) ins Spiel. Unsere Paneldaten - der Schlüssel zur Messung auf Personenebene - sind die perfekte Grundlage für das Training von Big Data.

Durch die Anwendung von KI nutzen wir Big Data, um unsere Messmöglichkeiten drastisch zu erweitern und gleichzeitig die Qualität und Repräsentativität zu wahren. KI ist heute ein wesentlicher Bestandteil unserer Messmethoden. So spielte sie beispielsweise eine entscheidende Rolle bei der Entwicklung unserer erweiterten Messmöglichkeiten für lokale TV-Märkte, die den Umfang von Big Data (Return Path Data {RPD} von TV-Geräten) mit vollständig repräsentativen Marktpaneldaten kombinieren.

Als wir versuchten, RPD in unsere lokalen Messungen zu integrieren, identifizierten wir vier Schlüsselanwendungen von AI.

Erkennen von Datenmustern

Als wir nach Möglichkeiten suchten, die RPD in unsere Messungen zu integrieren, haben wir die mit der RPD verbundenen Einschränkungen durch so genannte "Common Homes"-Analysen ermittelt. Für diese Analysen, die auch heute noch durchgeführt werden, vergleichen wir die Abstimmdaten von Nielsen-Messgeräten mit den RPD-Abstimmdaten. Diese Analysen decken jeden Monat mehr als 5.000 Haushalte (12.000 Fernsehgeräte) ab und haben ergeben, dass die RPD einige Abstimmungen übersieht.

Um dieses Manko zu beheben, haben wir eine zum Patent angemeldete Technik entwickelt, die mit Hilfe von Klassifikatoren die Muster erkennt, die mit der fehlenden Abstimmung in RPD-Häusern verbunden sind. Von dort aus entfernen KI-Algorithmen diese Häuser von der Verwendung bei der Messung.

Wissen, wann Set-Top-Boxen eingeschaltet und Fernsehgeräte ausgeschaltet sind

Die Nielsen-Analysen zu Hause analysieren mehr als 77 Millionen Sendeminuten in einem bestimmten Monat und liefern damit aussagekräftige Erkenntnisse. Diese Abstimmung ist jedoch nicht immer genau. Zum Beispiel schalten die Leute ihre Set-Top-Boxen nicht immer aus, wenn sie ihr Fernsehgerät ausschalten. Die RPD stellt diese Situationen als Fernsehkonsum dar, obwohl niemand zuschaut.

Wir können diese Einschränkung überwinden, indem wir Deep Learning-Klassifikatoren einsetzen, um Situationen zu erkennen, in denen die Set-Top-Box eingeschaltet ist, während der Fernseher ausgeschaltet ist. Der Algorithmus entfernt dann die ungültige Einstellung aus der RPD.

Identifizierung von Haushaltsmerkmalen und demografischen Informationen aus dem RPD

Die RPD ist namen- und gesichtslos und kann keine demografischen Informationen liefern. Demografische Informationen sind entscheidend für die korrekte Darstellung aller Teile einer Bevölkerung. Und darüber hinaus bedeutet eine genaue Messung, dass man in der Lage ist, Menschen zu messen, nicht nur Haushalte.

Um die leistungsstarken Informationen in RPD-Haushalten zu erschließen, kalibrieren wir RPD mit den bekannten Merkmalen, demografischen Daten und Abstimmungsinformationen von mehr als 45.000 von Nielsen gemessenen Haushalten sowie mit von Dritten zugewiesenen Merkmalen und demografischen Daten. Anschließend fügen wir diese Eingaben einem zum Patent angemeldeten rekurrenten neuronalen Netzwerk und einer gemischt-ganzzahligen Programmiertechnik hinzu, die die Merkmale und die Demografie von RPD-Haushalten genau identifiziert. Dieser KI-Algorithmus ermöglicht es uns, die demografischen Merkmale der Personen und Haushalte genau zu erfassen. 

Bestimmung des Standorts der Set-Top-Box

Die Nielsen-Panel-Informationen liefern Informationen über die Zuschauer und den Standort. RPD stellt beides nicht zur Verfügung. Wir können diese Informationen jedoch über AI von RPD erhalten. Wir verwenden eine wissenschaftlich erprobte Methode, um festzustellen, welches Haushaltsmitglied fernsieht und wo im Haushalt gesehen wird.

Untersuchungen haben ergeben, dass der Standort des Raums einer der wichtigsten Prädiktoren dafür ist, welche Haushaltsmitglieder zu den Zuschauern gehören. Daher verwenden wir einen Klassifikator, um den Raum zu identifizieren, in dem sich die Set-Top-Box befindet und in dem die Abstimmung in den RPD-Haushalten stattfindet. Auf diese Weise können wir diese Variable bei der Zuschauerzuweisung verwenden.

Bei der Fülle an Informationen, die heute zur Verfügung stehen, ist es verlockend, Big Data durch eine rosarote Brille zu betrachten. Ohne einen Bezug zu Personen sind Big Data jedoch alles andere als genau. Wir haben festgestellt, dass die künstliche Intelligenz ein wirksames Mittel ist, um Verzerrungen in Big Data zu beseitigen, und freuen uns, den Kunden diese Innovation anbieten zu können. Diese Innovation profitiert sowohl von der Fülle an Informationen, die Big-Data-Quellen liefern, als auch von einem Wahrheitsgehalt, der sicherstellt, dass sie auf der Grundlage repräsentativer und genauer Daten planen, aktivieren und messen können.

Dieser Artikel erschien zuerst auf Medium.

Fortsetzung der Suche nach ähnlichen Erkenntnissen