발전하는 기술의 혜택은 끝이 없어 보입니다. 휴대폰으로 집의 보안을 확인하고, 드론으로 식료품 배달을 받을 수 있으며, 심지어는 평행 주차가 가능한 자동차를 운전할 수도 있습니다. TV도 똑같이 발전하여 플랫폼과 채널이 계속 늘어나는 환경에서 무한한 콘텐츠 선택권을 제공하고 있습니다. 그러나 스마트 TV가 앞으로 몇 년 동안 열게 될 많은 문에도 불구하고, 그 자체만으로는 미디어 업계에 누가 TV를 사용하는지 정확하게 파악할 수 없을 것입니다.
스마트 TV가 지역 대형 유통업체의 TV 진열대를 점령했습니다. 오늘날 매장에서 인터넷이 연결되지 않은 TV를 찾기는 어려울 것입니다. 그리고 모든 연결된 디바이스와 마찬가지로 스마트 TV도 사용자 생성 데이터의 확산에 기여하고 있습니다: 자동 콘텐츠 인식(ACR) 데이터는 OEM이 스마트 TV의 튜닝을 캡처하는 데 사용하는 기술입니다. 이러한 데이터 세트는 대표적인 개인 수준의 행동을 자세히 설명하는 정보와 결합하면 시청자 측정의 과학을 크게 발전시킬 수 있습니다.
스마트 TV의 광범위한 채택과 그로부터 생성되는 데이터를 고려할 때, 다양한 기업들이 오디언스 측정 방법으로 ACR 데이터를 찾고 있는 것은 놀라운 일이 아닙니다. 규모만 놓고 보면 이 기회는 매우 매력적입니다. 그러나 ACR이 수익성이 높은 데이터 소스이기는 하지만, 오디언스 측정에서 가장 중요한 요소인 사람이 빠져 있기 때문에 그 자체만으로는 오디언스를 측정하기에는 충분하지 않습니다. ACR 데이터는 대표성이떨어질 뿐만 아니라 실제로 누군가가 화면에 표시되는 콘텐츠를 보고 있는지조차 알 수 없다는 치명적인 유효성 검사 결함이 있습니다. 따라서 ACR 데이터의 진정한 잠재력을 발휘하는 가장 좋은 방법은 실제 사람 수준의 시청 행동을 반영하는 데이터로 보정하는 것입니다.
설계된 대로 작동할 때 ACR 기술은 TV 유리에 투사되는 이미지를 모니터링하고 해당 이미지를 사용하여 표시되는 콘텐츠를 유추합니다. ACR이 제공하는 이미지는 여러 가지 면에서 콘텐츠의 지문과 같은 역할을 합니다. 하지만 이 기술은 '지문'을 수집한 후 이미지가 어떤 네트워크 또는 플랫폼에 표시되었는지, 언제 표시되었는지를 파악해야 합니다. 이러한 결정을 내리기 위해 기술은 화면의 이미지를 제조업체가 관리하는 참조 라이브러리에 포함된 이미지와 일치시켜야 합니다.
기술이 매칭을 시도할 때 발생할 수 있는 결과는 세 가지입니다:
- 이미지가 참조 라이브러리의 단일 항목과 일치합니다.
- 이미지가 참조 라이브러리의 여러 항목과 일치합니다.
- 일치하는 이미지가 참조 라이브러리에 없습니다.
관련된 모든 당사자에게 첫 번째 결과가 가장 이상적인 시나리오입니다. 두 번째 시나리오는 덜 이상적이며, 여러 네트워크에 걸쳐 방영, 반복 방영, 동시 방송 등 다양한 이유로 인해 어느 정도의 오인 위험이 수반됩니다. 세 번째 시나리오에서는 아무도 크레딧을 받지 못하는데, 이는 분명히 가장 바람직하지 않은 시나리오입니다. 이러한 결과가 발생하는 가장 일반적인 이유는 OEM이 모니터링하지 않는 네트워크에서 콘텐츠가 방영되기 때문입니다.
이미지 매칭이 실행 가능한 독립형 측정 솔루션이라고 해도 이를 활용하는 것은 결코 실현 불가능한 일입니다. 상상할 수 있듯이, 텔레비전의 모든 이벤트의 모든 프레임 라이브러리를 유지하는 데 드는 비용은 결코 작은 일이 아닙니다. 또한 영구적으로 기하급수적으로 늘어날 작업이기도 합니다. 또한 이미지에 대한 표준 보존 기간도 없습니다.
그렇다면 ACR 기술이 올바른 매칭을 만들어낼 수 있는지 어떻게 알 수 있을까요? 빈칸을 채울 수 있는 메커니즘이 없다면 알 수 없습니다. 그렇기 때문에 닐슨은 시그니처보다 훨씬 더 결정적인 워터마크와 측정된 모든 피드에 대한 시그니처 백업에 투자했습니다. 이를 통해 모든 콘텐츠를 대표하여 빅데이터와 관련된 공백을 스스로 메울 수 있습니다. 이러한 격차를 메우면 ACR과 같은 소스에서 제공되는 빅데이터는 점점 더 세분화되는 미디어 환경에서 규모의 이점을 제공합니다. 또한 가중치 컨트롤을 사용하여 개인 수준의 시청 데이터로 빅데이터를 보정하면 공백으로 남을 수 있는 비교 지점을 확인할 수 있습니다.
최근 연구에서 닐슨은 이러한 레퍼런스 라이브러리 격차가 ACR 기반 측정의 기초가 되는 ACR 튜닝 로그에 어느 정도 영향을 미치는지 파악하고자 했습니다. 2021년 9월의 일반 가정 분석에서는 두 ACR 제공업체 파트너의 데이터를 분석하여 참조 라이브러리 격차가 측정에 영향을 미칠 수 있는 부분을 파악했습니다. 이 연구에서는 시청 소스의 집중도와 사용 가능한 소스에서 시청한 시간을 모두 살펴봤습니다.
모든 시청 소스에서 ACR 제공 파트너가 사용 가능한 방송국 중 31%만 모니터링하는 것으로 나타났습니다. 즉, 방송국의 69%에 대한 데이터를 참조 라이브러리에 보관하지 않는다는 뜻입니다. 조회된 분량을 살펴본 결과, 23%의 분량이 모니터링되지 않는 방송국에서 나온 것으로 나타났습니다. 즉, ACR 데이터만 활용하여 측정하는 기업은 가구 단위 노출 수를 23% 과소 계산하고 있는 것입니다.
ACR 데이터 자체의 한계에도 불구하고, 저희는 이 데이터가 셋톱박스의 RPD(Return Path Data)와 유사한 추가적인 커버리지 소스로서 제공하는 규모와 범위의 기회를 잘 알고 있으며, 빅데이터 전략에서도 패널 데이터로 보정하여 비슷한 한계를 해결하고 있습니다. 미국 전체를 대표할 수 있는 시청 데이터와 빅데이터 세트를 통합함으로써 표본 크기를 크게 늘리는 동시에 엄격한 데이터 과학 방법론을 적용하여 격차를 메우고 모든 네트워크와 플랫폼에서 미국 전체 시청자를 공정하게 대표할 수 있습니다.
이 글의 원본 버전은 애드익스체인지에 게재되었습니다.