Przejdź do treści
02_Elements/Icons/ArrowLeft Powrót do Insight
Spostrzeżenia > Perspektywy

Big data z inteligentnych telewizorów nie wystarczy do mierzenia oglądalności

5 minut czytania | Jonathon Wells, SVP, Data Science | październik 2022 r.

Korzyści płynące z rozwoju technologii wydają się nie mieć końca. Możemy sprawdzać bezpieczeństwo naszych domów za pomocą telefonów, otrzymywać dostawy produktów spożywczych za pomocą dronów, a nawet prowadzić samochody, które potrafią parkować równolegle za nas. Nasze telewizory stają się równie zaawansowane, oferując pozornie nieskończony wybór treści w ramach stale rosnącego krajobrazu platform i kanałów. Jednak pomimo wielu drzwi, które inteligentne telewizory otworzą w nadchodzących latach, same nie będą w stanie zapewnić branży medialnej dokładnego obrazu tego, kto z nich korzysta.

Telewizory Smart TV opanowały dział z telewizorami w lokalnych sklepach wielkopowierzchniowych. Trudno dziś znaleźć w sklepie telewizor, który nie jest podłączony do internetu. Podobnie jak wszystkie urządzenia podłączone do sieci, inteligentne telewizory przyczyniają się do rosnącej liczby danych generowanych przez użytkowników: Automatyczne rozpoznawanie treści (ACR) to technologia, którą producenci OEM wykorzystują do przechwytywania tuningu w inteligentnych telewizorach. W połączeniu z informacjami, które szczegółowo opisują reprezentatywne zachowania na poziomie poszczególnych osób, te zestawy danych znacznie poszerzają możliwości pomiaru oglądalności.

Biorąc pod uwagę szerokie rozpowszechnienie inteligentnych telewizorów i danych, które one generują, nie jest zaskakujące, że wiele firm poszukuje danych ACR jako sposobu pomiaru oglądalności. Z perspektywy samej skali, możliwość ta jest bardzo atrakcyjna. Jednak tak lukratywne źródło danych, jakim jest ACR, nie jest wystarczające do pomiaru widowni, po prostu dlatego, że brakuje w nim najważniejszego aspektu pomiaru widowni: ludzi. Oprócz tego, że dane ACR nie są reprezentatywne - lubnawet nie wiedzą, czy ktoś faktycznie ogląda to, co jest na ekranie - mają krytyczną wadę: wymagają od producenta urządzenia dopasowania obrazu na ekranie do obrazu referencyjnego w celu określenia, jaka treść jest wyświetlana. Dlatego najlepszym sposobem na uwolnienie prawdziwego potencjału danych ACR jest ich kalibracja za pomocą danych, które odzwierciedlają rzeczywiste zachowanie osób oglądających. 

Działając zgodnie z założeniami, technologia ACR monitoruje obrazy wyświetlane na szybie telewizora i wykorzystuje je do wnioskowania o wyświetlanej treści. Obrazy dostarczane przez ACR działają pod wieloma względami jak odcisk palca treści. Jednak po zebraniu "odcisków palców" technologia musi określić, w jakiej sieci lub na jakiej platformie pojawił się obraz, a także kiedy się pojawił. Aby to ustalić, technologia musi dopasować obraz na ekranie do obrazu znajdującego się w bibliotece referencyjnej utrzymywanej przez producenta.

Istnieją trzy możliwe wyniki, gdy technologia próbuje dokonać tego dopasowania:

  • Obraz pasuje do pojedynczego wpisu w bibliotece referencyjnej 
  • Obraz pasuje do wielu pozycji w bibliotece referencyjnej
  • Pasującego zdjęcia nie ma w bibliotece

Dla wszystkich zaangażowanych stron, pierwszy wynik jest idealnym scenariuszem. Drugi scenariusz jest mniej idealny i wiąże się z pewnym ryzykiem błędnego zaliczenia, po prostu ze względu na różne powody wielokrotnych meczów (np. emisje w różnych sieciach, powtórki, simulcasty). W trzecim scenariuszu nikt nie otrzymuje punktów, co jest oczywiście najmniej pożądanym scenariuszem. Najczęstszym powodem takiej sytuacji jest fakt, że treść została wyemitowana w sieci, której OEM nie monitoruje.

Nawet gdyby dopasowywanie obrazów było opłacalnym samodzielnym rozwiązaniem pomiarowym, możliwość wykorzystania go jako takiego nigdy nie byłaby wykonalna. Jak można sobie wyobrazić, koszt utrzymania biblioteki każdej pojedynczej klatki każdego wydarzenia w telewizji nie jest małym zadaniem. Jest to również zadanie, które będzie rosło wykładniczo w nieskończoność. Nie ma też standardowych okresów przechowywania obrazów.

Skąd więc mamy pewność, że technologia ACR doprowadzi do właściwego dopasowania? Bez mechanizmu, który może wypełnić puste miejsca, nie mamy takiej pewności. Dlatego Nielsen zainwestował w znaki wodne, które są znacznie bardziej deterministyczne niż podpisy, a także w kopie zapasowe podpisów dla każdego mierzonego kanału. To zapewnia reprezentację wszystkich treści - wypełniając luki związane z big data przez siebie. Po wypełnieniu tych luk, duże dane pochodzące ze źródeł takich jak ACR zapewniają korzyści skali w coraz bardziej podzielonym krajobrazie medialnym. A kiedy używamy kontroli wagi, aby skalibrować duże dane z danymi dotyczącymi oglądalności na poziomie osoby, jesteśmy w stanie zobaczyć punkty porównawcze, które w przeciwnym razie byłyby puste.

W ostatnim badaniu Nielsen starał się zrozumieć, w jakim stopniu te braki w bibliotekach referencyjnych wpływają na logi strojenia ACR - podstawę pomiaru opartego na ACR. W analizie Common Home z września 2021 roku, przeanalizowaliśmy dane od naszych dwóch dostawców ACR, aby zrozumieć, gdzie luki w bibliotekach mogą wpływać na pomiar. W naszym badaniu przyjrzeliśmy się zarówno koncentracji źródeł oglądania, jak i liczbie obejrzanych minut z dostępnych źródeł. 

Biorąc pod uwagę wszystkie źródła oglądalności, stwierdziliśmy, że nasi partnerzy dostarczający ACR monitorują zaledwie 31% dostępnych stacji. Oznacza to, że nie przechowują oni w swoich bibliotekach danych dotyczących 69% stacji. Kiedy przyjrzeliśmy się oglądanym minutom, okazało się, że 23% minut pochodzi ze stacji, które nie są monitorowane. Oznacza to, że firmy korzystające z samych danych ACR do pomiaru będą zaniżać liczbę wyświetleń na poziomie gospodarstwa domowego o 23%.

Pomimo ograniczeń danych ACR, rozumiemy możliwości skali i zasięgu, które zapewniają dodatkowe źródło pokrycia - podobnie jak w przypadku danych o ścieżkach powrotu (RPD) z dekoderów, które nasza strategia big data również kalibruje z danymi panelowymi, aby rozwiązać porównywalne ograniczenia. Poprzez integrację zbiorów big data z naszymi danymi dotyczącymi oglądalności, które zapewniają reprezentatywny pomiar całej populacji Stanów Zjednoczonych, jesteśmy w stanie znacząco zwiększyć wielkość próby, jednocześnie stosując rygorystyczne metodologie data science, aby wypełnić luki i zapewnić uczciwą reprezentację całej amerykańskiej widowni we wszystkich sieciach i platformach.

Wersja tego artykułu pierwotnie pojawiła się w serwisie AdExchanger.