跳至内容
02_Elements/Icons/ArrowLeft 返回洞察力
洞察力>媒体

返回发件人:仅凭大数据如何产生偏见和缺乏代表性

6 分钟阅读 | 2019 年 3 月

在设备和受众碎片化的今天,每个观众显然都是重要的潜在消费者,即使他们的个性化内容消费以及内容本身的颗粒度更细。

能够以公平地代表所有 种族、年龄、民族和行为的方式进行衡量,对于整个行业充满信心地进行交易至关重要。这也是确保内容选择反映特定电视台社区多样性的唯一途径。

无论是节目制作者希望了解真实受众的多样性构成以做出节目编排决策,还是广告商希望通过精准的信息触及特定人群,抑或是媒体所有者通过在选角时考虑到多样性而在屏幕包容性方面做出更多努力,业内所有运营商都有了解真实受众构成的业务需求。这就是为什么他们所依赖的任何测量见解都必须能够充分代表美国人口的丰富多样性。任何一个或多个群体都不应被有意或无意地排除在外或代表性不足。

简而言之,"小众 "观众或网络已不复存在,任何受众都不应该因为测量过程没有考虑到他们,或者更糟的是,甚至没有考虑到他们而被遗忘。在测量方面,包容性是当务之急,而不是一种选择。

虽然大数据有很多好处,但如果公司不负责任地对待它,也会带来负面影响。利用大数据的优势(如在高度分散的收视环境中提供稳定的测量)和真正的人际测量是至关重要的。简而言之,大数据作为一种独立的资源,并不适合全面了解受众动态。

尼尔森(Nielsen)最近的一份分析报告探讨了在没有考虑代表性的情况下建立的大数据如何会因为固有的偏差而掩盖真正的受众,因为数据包括没有机顶盒的人,利用 空中(OTA)信号和流媒体(OTT)内容观看优质电视节目的人。

具体而言,该分析试图了解返回路径数据(RPD)--拥有能够返回数据的机顶盒的家庭--与使用根据尼尔森观众面板校准的观众数据的家庭之间的观众测量差异。分析发现,未经校准的 RPD 数据使用了可疑的加权方法,对少数群体观众的计算不足,而且存在固有偏见。将其与 "人口普查 "数据相提并论是一种方法论上的轻信。

毕竟,美国人对视频节目的需求已不再千篇一律。一些人没有足够的收入来购买高级娱乐内容;另一些人则在数字技术不断进步的情况下选择观看 OTA 节目。广泛的技术进步也推动了纯宽带(BBO)家庭的稳步增长。在美国,OTA 和 BBO 家庭的数量从 2014 年的 1500 万个增加到 2018 年的近 2800 万个。如果考虑到这 2,800 万个家庭中有 41% 的消费者是多元文化(西班牙裔、非裔美国人或亚裔),10% 的消费者是年轻人群(18-24 岁),那么很明显,RPD 样本对这些受众的代表性会明显不足,从而使受众总数的测量出现偏差。

与其他家庭类型相比,仅有支持 RPD 的数据对西班牙裔和非洲裔家庭的代表性一直不足。与美国官方人口普查估计值和尼尔森的全国代表性面板相比,支持 RPD 的家庭对西班牙裔的代表性不足 33%,对西班牙语为主的西班牙裔的代表性不足 49%,对非裔美国人的代表性不足 34%。如果将支持 RPD 的家庭与支持 OTA/BBO 的家庭进行比较,其代表性差距会更大。具备 RPD 功能的测量结果对西班牙裔的代表性不足 50%,对西班牙语占主导地位的西班牙裔的代表性不足 68%,对非裔美国人的代表性不足 38%。仅靠加权并不能解决这一问题,数百万个 RPD 家庭被计算在内也无关紧要。有偏差的大样本仍然是有偏差的。

而且,这些信息来源偏向的不仅仅是多元文化受众。

从年龄角度看,具备 RPD 功能的数据对年轻群体的代表性不足,而对年长群体的代表性过高。例如,25-34 岁的消费者被低估了 26%,而 50 岁以上的消费者实际上被高估了 15%。那么 18-34 岁这一更大的关键人群呢?尼尔森的全国面板和人口普查数据还显示,截至 2018 年 12 月,电视家庭中有 6980 万 18-34 岁的成年人。这一人群正在引领剪线革命,在剪线用户中占比最大。但是,与具有代表性的面板相比,具备 RPD 功能的家庭对 18-34 岁成年人进行准确分型的可能性要低 17%。

由于对 18-34 岁成人的计算不足,营销人员、媒体所有者以及介于两者之间的所有人如果仅依靠 RPD 数据,可接触到的受众人数就会减少。对这一问题进行加权可能会掩盖 RPD 数据的固有问题,但并不能解决问题或揭示这些受众的独特收视行为。RPD 家庭并不代表非 RPD 家庭的收视情况。每隔几年偶尔进行的在线调查应用于复杂的日常收视记录,是一种廉价而粗心的方法,看起来好像已经纠正了什么问题。

对属于 RPD 群体、不具备 RPD 功能群体(这意味着这些消费者可能拥有一个不返回数据的机顶盒)和日益增长的 OTA/BBO 群体的消费者进行调查,可以发现他们的行为和生活方式存在明显差异。无论如何加权,也无论大数据输入的规模有多大,无论是 3000 万、10 亿还是万亿样本,这都只能通过直接观察获得。

那么,这对由多元文化受众推动的实际节目制作意味着什么呢?这意味着需要考虑所有来源,观察所有类型的受众,以便将其纳入大数据集并进行校准。

例如,像福克斯公司的《帝国 》这样的节目,其观众构成主要是多元文化,分析发现,考虑到该节目作为接近顶级节目的历史,这些观众并不 "小众"。事实上,在 2018 年 12 月,多元化观众占《帝国 》的 75%,在使用具有代表性的面板时,这些观众无疑有助于推动收视率的成功。

但是,由于其固有的代表性不足的偏见,这些多元文化的观众并没有得到公平的反映,导致在通过 RPD 镜头观察该剧时,《帝国》的观众人数严重不足。差异相当大。从 25-54 岁观众的排名来看,《帝国》在尼尔森的代表小组中排名第 16 位,但在 RPD 家庭中却跌至第 38 位。相反,《帝国 》在 OTA 家庭中排名第三,虽然这并不令人惊讶,因为这些家庭更加多样化,但这也表明了在任何样本中实际纳入这些家庭并准确衡量其行为的重要性。

归根结底,依赖任何不全面、不准确、不包容的测量方法,都会损害包容性的基本要素和核心原则。根据定义将这些 "小众 "观众及其行为排除在外会产生深远的影响,可能会给市场和营销人员带来不稳定的错误信息,甚至会阻碍屏幕包容性的发展。

继续浏览类似的见解