콘텐츠로 건너뛰기
02_Elements/아이콘/왼쪽 화살표 인사이트로 돌아가기
인사이트 > 미디어

발신자에게 반환: 빅 데이터만으로는 편향되고 대표성이 없는 방법

6 분간 읽기 | 2019년 3월

장치와 청중이 파편화되는 시대에는 콘텐츠 소비와 콘텐츠 자체의 개인화가 훨씬 더 세분화되어 있더라도 모든 시청자가 중요한 잠재적 소비자임이 분명합니다.

모든 인종, 연령, 민족 및 행동을 공정하게 대표하는 방식으로 측정할 수 있는 능력은 업계가 자신 있게 거래하는 데 매우 중요합니다. 또한 콘텐츠 선택이 특정 방송국 커뮤니티의 다양성을 반영하도록 하는 유일한 방법이기도 합니다.

진정한 오디언스 다양성의 구성을 파악하고, 일정을 결정하려는 프로그래머, 정확한 메시지로 특정 세그먼트에 도달하려는 광고주, 다양성을 염두에 두고 캐스팅하여 화면에 포함되도록 더 많은 노력을 기울이는 미디어 소유자 등 업계의 모든 운영자는 진정한 오디언스 구성이 무엇인지 알아야 하는 비즈니스 과제를 안고 있습니다. 그렇기 때문에 그들이 의존하는 모든 측정 통찰력은 미국 인구의 풍부한 과거를 완전히 대표하는 것이 중요합니다. 어떤 그룹이나 그룹도 고의로 또는 무의식적으로 배제되거나 과소 대표되어서는 안 됩니다.

요컨대, "틈새" 시청자 또는 네트워크와 같은 것은 더 이상 존재하지 않으며, 시청자를 설명하지 못하거나 더 나쁘게는 고려조차 하지 못하는 측정 프로세스로 인해 시청자가 뒤처져서는 안 됩니다. 측정과 관련하여 포용성은 선택이 아닌 필수입니다.

빅 데이터에는 많은 장점이 있지만 기업이 이를 책임감 있게 처리하지 않으면 단점도 있습니다. 파편화된 시청 환경에서 측정 안정성을 제공하는 것과 같이 이 데이터가 제공해야 하는 강점을 실제 개인 수준의 측정으로 활용하는 접근 방식이 중요합니다. 간단히 말해, 독립형 리소스로서의 빅 데이터는 청중의 역학을 완전히 이해하는 데 적합하지 않습니다.

최근 Nielsen 분석에서는 셋톱 박스가 없는 사람들, OTA(Over-the-Air) 신호를 활용하고 프리미엄 TV 프로그램을 시청하기 위해 OTT(Over-the-Top) 콘텐츠를 스트리밍하는 사람들과 같은 데이터에 포함된 데이터에 따라 대표성을 염두에 두지 않고 구축된 빅 데이터가 내재된 편견으로 인해 실제 시청자가 무엇인지 모호하게 만들 수 있음을 살펴보았습니다.

특히, 이 분석은 데이터를 반환할 수 있는 셋톱 박스가 있는 가정인 RPD(Return Path Data)와 Nielsen의 시청자 패널을 기반으로 보정된 시청자 데이터가 있는 가정 간의 시청자 측정 차이를 이해하고자 했습니다. 분석 결과, 모호한 가중치 부여 방법론을 사용하는 보정되지 않은 RPD 데이터가 소수 오디언스를 과소 집계하고 본질적으로 편향되어 있는 것으로 나타났습니다. 이를 "인구 조사" 데이터에 비유하는 것은 방법론적 믿음의 도약이다.

어쨌든 미국인들은 더 이상 비디오 프로그래밍 요구에 동일하게 접근하지 않습니다. 일부는 프리미엄 엔터테인먼트 콘텐츠에 지출할 수입이 없습니다. 다른 사람들은 디지털 기술 향상에 비추어 OTA 프로그래밍을 선택합니다. 광범위한 기술 발전은 광대역 전용(BBO) 주택의 꾸준한 성장을 촉진했습니다. OTA와 BBO 주택의 결합은 미국에서 2014년 1,500만 가구에서 2018년 거의 2,800만 가구로 증가했습니다. 2,800만 가구의 소비자 중 41%가 다문화(히스패닉, 아프리카계 미국인 또는 아시아인)이고 10%가 젊은 층(18-24세)이라는 점을 고려하면 RPD 표본이 이러한 잠재고객을 현저히 과소 대표하고 전체 잠재고객 측정을 왜곡할 것이 분명합니다.

RPD 지원 데이터만으로도 히스패닉 및 아프리카계 미국인 주택은 다른 가구 유형에 비해 지속적으로 과소 대표됩니다. 공식 미국 인구 조사 추정치와 Nielsen의 대표 국가 패널과 비교할 때 RPD 가능 주택은 히스패닉을 33%, 스페인어를 주로 사용하는 히스패닉이 49%, 아프리카계 미국인이 34% 과소 대표됩니다. RPD가 가능한 주택과 OTA/BBO 주택을 비교하면 대표성 격차가 훨씬 더 큽니다. RPD 가능 측정은 히스패닉을 50%, 스페인어를 주로 사용하는 히스패닉을 68%, 아프리카계 미국인을 38% 과소 대표합니다. 가중치만으로는 이 문제를 해결할 수 없으며, 수백만 개의 RPD 주택이 집계된다는 사실은 중요하지 않습니다. 편향된 큰 표본은 여전히 편향되어 있습니다.

그리고 이러한 출처가 왜곡되는 것은 다문화 청중만이 아닙니다.

연령 관점에서 RPD 지원 데이터는 젊은 데모를 과소 대표하고 고연령 그룹을 과대 대표합니다. 예를 들어, 25-34세의 소비자는 26%가 과소 집계되는 반면, 50+세의 소비자는 실제로 15%가 과대 대표됩니다. 18-34의 더 큰 키 데모는 어떻습니까? 닐슨의 전국 패널 및 인구 조사 데이터에 따르면 2018 년 12 월 현재 TV 가구 내에 18-34 세 성인이 6,980 만 명 있습니다. 이 데모는 코드 커팅 혁명을 주도하고 있으며 데모별로 코드 커터의 가장 큰 점유율을 차지합니다. 그러나 RPD가 가능한 가정은 18-34세 성인을 대표하는 패널보다 정확하게 유형화할 가능성이 17% 낮습니다.

18-34세 성인을 과소 집계하면 마케터, 미디어 소유자 및 그 사이의 모든 사람이 RPD 데이터에만 의존할 경우 도달할 수 있는 사람이 더 적습니다. 이 문제에 가중치를 부여하면 RPD 데이터에 내재된 문제가 숨겨질 수 있지만 문제가 해결되거나 이러한 잠재고객의 고유한 시청 행동을 발견할 수는 없습니다. RPD 주택은 RPD가 아닌 주택의 보기를 나타내지 않습니다. 몇 년에 한 번씩 실시되는 온라인 설문조사를 복잡한 일일 시청 기록에 적용하는 것은 무언가가 수정된 것처럼 보이게 하는 값싸고 부주의한 방법입니다.

RPD 그룹, RPD를 사용할 수 없는 그룹(즉, 이러한 소비자는 데이터를 반환하지 않는 셋톱 박스를 가지고 있을 수 있음) 및 성장하는 OTA/BBO 그룹에 속한 소비자를 살펴보면 행동과 라이프스타일에서 현저한 차이가 있음을 알 수 있습니다. 이것은 얼마나 많은 가중치가 수행되고 빅 데이터 입력의 크기에 관계없이 3천만 개, 10억 개 또는 조 개의 샘플에 관계없이 직접 관찰을 통해서만 수집할 수 있는 것입니다.

그렇다면, 이것이 다문화 관객에 의해 구동되는 실제 프로그램에 어떤 의미가 있을까요? 즉, 모든 소스를 고려해야 하며 모든 유형의 청중을 관찰하여 빅 데이터 세트로 계산하고 보정해야 합니다.

예를 들어, Fox's Empire와 같은 쇼의 경우 , 시청자 구성이 대부분 다문화인 경우, 분석 결과 이러한 시청자는 상위권에 가까운 프로그램으로서의 쇼의 역사를 고려할 때 "틈새 시장"이 아니라는 것을 발견했습니다. 실제로 2018년 12월 Empire 의 75%는 다양한 오디언스가 차지했으며, 이러한 오디언스는 대표 패널을 사용했을 때 시청률 성공을 이끄는 데 확실히 도움이 되었습니다.

그러나 과소 대표성이라는 내재된 편견으로 인해 이러한 다문화 관객은 공정하게 반영되지 않아 RPD 렌즈를 통해 이 쇼를 볼 때 Empire의 관객이 상당히 과소 집계되었습니다. 그 차이는 상당히 큽니다. 25-54세 시청자 순위를 살펴보면 Empire 는 Nielsen의 대표 패널을 사용하여 16위를 차지했지만 RPD 가정에서는 38위로 떨어졌습니다. 반대로, Empire 는 OTA 주택 중 3위를 차지했는데, 이는 이러한 주택이 더 다양하기 때문에 놀라운 일은 아니지만 실제로 이러한 주택을 포함하고 모든 샘플에서 행동을 정확하게 측정하는 것이 중요하다는 것을 보여줍니다.

결국, 완전하고 정확하며 포괄적인 측정과 포용성의 기본 요소 및 핵심 원칙에 의존하지 않는 접근 방식을 찾는 것은 타협될 수 있습니다. 이러한 "틈새" 시청자와 그들의 행동을 정의에 따라 계산하는 것은 잘못된 정보로 시장과 마케터를 불안정하게 만들고 심지어 화면 내 포용을 방해할 수 있는 광범위한 영향을 미칠 수 있습니다.

유사한 인사이트 계속 탐색