콘텐츠로 건너뛰기
02_Elements/아이콘/왼쪽 화살표 인사이트로 돌아가기
미디어> 통찰력

기계 학습을 사용하여 진화하는 미디어 환경에서 미래의 TV 등급 예측

5분 읽기 | 닐슨의 데이터 과학 부문 부사장 Jingsong Cui, 데이터 과학 부문 매니저 Scott Sereday | 2016년 10월

미디어 회사와 광고주는 매일 TV 등급에 의존하여 TV 프로그램의 성공을 측정하고, 시청자 규모와 구성이 미디어 구매 대상에 비해 전달되고 있는지 확인하고, 숫자가 부족할 경우 좋은 결과를 얻습니다. 이러한 관점에서 TV 등급은 TV 시청의 과거 또는 현재를 측정하는 메트릭입니다.

그러나 미디어 회사들은 또한 미래를 예측하기 위해 등급을 사용하고 있습니다. 등급은 기대치를 설정하고 한 시즌에서 다음 시즌까지 프로그래밍 결정에 영향을 미칩니다. 또한 캠페인이 실제로 방송 될 수있는 시점 이전에 광고 비율을 설정하는 데 도움이됩니다. 예를 들어, 미국에서는 TV 네트워크가 시즌 광고 인벤토리의 대부분을 일년에 한 번만 조직하는 이벤트 인 "선행"(3 월과 5 월 사이)에서 판매합니다. 즉, 오늘날 TV에서 보는 광고의 비율은 일 년 전에 협상되었을 수 있습니다.

쇼의 등급이 세 달, 여섯 달 또는 12 개월 안에 어떻게 될지 예측하기 위해 연구자들은 예측 모델을 사용하고 있습니다. 이러한 모델 중 상당수는 수정이 거의 없거나 전혀 없이 수년간 사용되어 왔습니다. 그들은 등급을 예측하는 데 성공했으며 매년 수십억 달러의 광고 달러 교환을 지원하는 훌륭한 업무를 수행했습니다. 그러나 TV 생태계의 빠른 변화로 인해 신뢰할 수있는 모델을 개발하는 것이 점점 더 어려워지고 있습니다.

미디어 업계의 최근 기술 혁신 목록을 고려하십시오 : 시청자는 점점 더 노트북, 태블릿 및 스마트 폰을 사용하여 콘텐츠를 시청하고 있습니다. Netflix 및 Amazon Prime과 같은 스트리밍 서비스는 대량 채택에 도달했습니다. 새로운 TV 연결 장치가 대형 화면 환경을 재구성하고 있습니다. 사람들은 시간을 바꾸고, 스트리밍하고, 폭음을 시청하고 있으며, 소비하는 미디어를 그 어느 때보 다 더 잘 제어 할 수 있습니다. 그들의 행동은 더 복잡 할뿐만 아니라 예측할 수도 없습니다.

닐슨은 사람들이 미디어를 소비하는 방식을 측정하는 많은 데이터 리소스에 액세스할 수 있습니다. 디지털 TV 데이터를 믹스에 추가하기 전에(예측 모델의 입력 및 출력으로), 우리는 전통적인 TV 데이터를 유일한 소스로 사용하여 기존 TV의 등급을 예측하는 방법을 먼저 개선할 수 있는지 여부를 조사하고자 했습니다. 닐슨 내셔널 피플 미터(Nielsen National People Meter) 덕분에 우리는 일관된 방법론과 전국적으로 대표적인 시청자들로 구성된 강력한 패널과 함께 수년 전으로 거슬러 올라가는 고품질 데이터를 보유하고 있습니다.

우리는 새로운 예측 모델을 만들기 위해 매우 상세한 수준으로이 풍부한 데이터를 활용했습니다 : 과거 Live + 7 등급 (즉, 라이브 시청자뿐만 아니라 초기 방송 후 7 일까지 시청자를 포함하는 등급), C3 등급 (3 일 후까지 재생을 포함하는 상업 등급), HUT (언제든지 TV를 사용하는 가구의 비율), 도달 범위, 가구 등급, 인구 통계 학적 등급, 요일, 시간 및 네트워크의 ID는 우리가 입력 변수로 사용한 핵심 정보 중 일부입니다. 우리는 고급 기계 학습 및 통계 알고리즘 (예 : 능선 회귀, 무작위 숲 및 그라디언트 부스팅)을 활용하여 관련 데이터 관계를 식별했습니다.

고객과 협력하여 우리는 우리가 만든 모델을 테스트하고 검증하기 위해 여러 가지 개념 증명 연구를 수행했습니다. 우리는 세분화 된 수준 (남성 2-5 세 또는 여성 65 +와 같은 소규모 인구 통계 그룹의 경우 시간 블록)에서 미래 등급을 예측하도록 모델을 설계했지만 이러한 수치를 네트워크 수준으로 롤업했습니다. 우리의 모델이 현실에 대해 어떻게 수행되는지 이해하기 위해, 우리는 두 분기의 보류 기간을 사용하여 예측과 고객의 내부 예측을 실제 등급 데이터와 비교했습니다. 예를 들어, 2015년 2분기 동안 화요일 오후 9시에서 오후 10시 사이에 네트워크 A의 30-34명에 대한 평균 Live+7 등급은 2014년 1분기까지의 과거 데이터만을 기반으로 1.94의 평균 Live+7 등급을 정확하게 예측했습니다. 예측은 우리가 99 % R- 제곱 (설명 된 분산의 비율)이있는 네트워크 수준에서 매우 정확했지만 더 세분화 된 시간 블록 일별 수준 또는 일부 소규모 인구 통계 학적 그룹에서는 더 어려웠습니다. 그러나 시간 블록 수준에서도 우리 모델의 R 제곱은 여전히 95 %를 상회했으며 고객이 그 시점까지 의존했던 모델보다 훨씬 뛰어났습니다. 2,000개 이상의 주간 예측에서 우리의 예측은 R-제곱에 대해 41% 더 정확했고 가중 절대 백분율 오차(WAPE)에 대해 16% 더 정확했으며, 이는 예측 정확도의 두 가지 주요 척도입니다.

우리는 개념 증명 모델과 다가오는 논문에서 수행 한 테스트에 대한 자세한 내용을 공유 할 것입니다. 이 프로젝트의 핵심 테이크 아웃은 크고 시끄러운 행동 데이터를 예측 모델링 기능으로 변환하고 매우 효율적이고 자동화 된 방식으로 그렇게 할 수 있다는 것입니다. 그러나 평가 포인트의 모든 소수점은 엄청난 재정적 영향을 미치며, 새로운 입력 변수 (예 : 광고 지출 또는 프로그램 별 데이터)를 추가하거나, 프로그래밍 패키지 및 채널 라인업의 변화에 신속하게 적응할 수있는 방법을 구축하거나, 새로운 형태의 회귀 및 분류 알고리즘을 테스트하거나, 여러 유망한 모델을 하나로 결합하여 봉투를 계속 밀어 붙일 필요가 있습니다.

이 프로젝트는 전통적인 TV에 초점을 맞추었지만 디지털 데이터의 영향은 과거 데이터의 TV 등급 변화와 예측에도 반영된다는 점에 주목하는 것이 흥미 롭습니다. 그러나 이것은 누적 효과에 대한 간접적 인 측정이며 예를 들어 오버 더 탑 시청 또는 스마트 폰 앱에서보기에 특별히 초점을 맞춘 모델을 대체 할 수는 없습니다. 위에서 설명한 다음 단계 외에도 디지털 데이터의 사용은 향후 예측을 개선하는 데 중요한 요소가 될 것입니다.

결국, 우리는 또한 각 고객이 프로그램에 대한 친밀한 지식과 미래에 이러한 프로그램을 어떻게 받아 들일 수 있는지에 대한 강한 직관력을 가지고 있음을 인식해야합니다. 예측 모델을 만들 때 "인간 요소"를 무시해서는 안되며 시장의 중요하고 예기치 않은 변화에 대응할 때 특히 유용 할 수 있습니다. 풍부한 데이터, 강력한 기계 학습 알고리즘 및 도메인 전문 지식을 통합하는 시스템은 자체적으로 달성 할 수있는 것보다 더 나은 결과를 얻을 수 있습니다.

관련 태그:

유사한 인사이트 계속 탐색