
技术进步带来的好处似乎是无穷的。我们可以从我们的手机上检查我们的家庭安全,接收无人机送来的杂货,甚至驾驶可以为我们平行停车的汽车。我们的电视也变得同样先进,在不断增长的平台和频道中提供似乎无穷无尽的内容选择。然而,尽管智能电视在未来几年将打开许多大门,但它们本身并不能为媒体行业提供一个关于谁在使用它们的准确观点。
智能电视已经占领了当地大卖场的电视过道。今天,你很难在商店里找到一台没有联网的电视。就像所有的连接设备一样,智能电视使用户产生的数据越来越多:自动内容识别(ACR)数据是原始设备制造商用来捕捉智能电视上的调谐的技术。当与详细说明具有代表性的个人层面行为的信息相结合时,这些数据集大大推进了受众测量的科学性。
鉴于智能电视的广泛采用和它们产生的数据,一系列公司正在寻找ACR数据作为衡量受众的方式,这并不奇怪。从纯粹的规模角度来看,这个机会是非常有吸引力的。然而,尽管ACR是一个有利可图的数据来源,但它本身并不足以衡量观众,因为它缺乏观众测量中最重要的方面:人。除了 没有代表性,或者甚至不知道是否有人真的在看屏幕上的内容之外,ACR数据还有一个关键的验证缺陷:它要求设备制造商将屏幕上的图像与参考图像相匹配,以确定正在显示的内容。因此,释放ACR数据的真正潜力的最好方法是用反映真实的个人观看行为的数据对其进行校准。
当按照设计工作时,ACR技术监测投射在电视玻璃上的图像,并使用这些图像来推断正在显示的内容。ACR所提供的图像在许多方面就像内容的指纹。但在收集 "指纹 "后,该技术需要确定图像出现在哪个网络或平台上,以及何时出现。为了做出这一判断,该技术需要将屏幕上的图像与制造商维护的参考库中的图像相匹配。
当技术试图进行这种匹配时,有三种可能的结果:
- 该图像与参考资料库中的一个条目相匹配
- 该图像与参考库中的多个条目相匹配
- 匹配的图像不在参考库中

对于所有参与方来说,第一种结果是最理想的情况。第二种情况不那么理想,它伴随着一定程度的误判风险,原因很简单,因为有多种原因导致多场比赛(例如,跨网络播出、重复播出、同步播出)。在第三种情况下,没有人得到信用,这显然是最不理想的情况。这种结果最常见的原因是,内容在OEM不监控的网络上播出。
即使图像匹配是一个可行的独立的测量解决方案,利用它的能力也是不可行的。正如你可以想象的那样,维护电视上每一个事件的每一帧的资料库的成本不是一个小任务。这也是一项将永远呈指数级增长的任务。图像也没有标准的保留期。
那么,我们怎么知道ACR技术会做出正确的匹配?如果没有一个可以填补空白的机制,我们就不知道。这就是为什么尼尔森投资于水印的原因,水印的确定性远远高于签名,同时也为每一个测量的饲料提供签名备份。这提供了所有内容的代表性--填补了与大数据本身相关的空白。随着这些差距的填补,来自ACR等来源的大数据在日益细分的媒体环境中提供了规模的好处。而当我们使用加权控制来校准大数据和个人层面的观看数据时,我们能够看到原本空白的比较点。
在最近的一项研究中,尼尔森希望了解这些参考图书馆的差距对ACR调整日志的影响程度--基于ACR的测量基础。在2021年9月的共同家园分析中,我们分析了来自我们两个ACR供应商合作伙伴的数据,以了解参考库的差距可能会影响到测量。在我们的研究中,我们观察了观看来源的集中度以及从可用来源中观看的分钟数。
在所有的收视来源中,我们发现我们的ACR供应商合作伙伴只监控了31%的可用电台。这意味着他们没有在其参考资料库中保存69%的电视台的数据。当我们观察观看的分钟数时,我们发现23%的分钟数来自未被监控的电台。这意味着仅利用ACR数据进行测量的公司将少计算23%的家庭级印象。
尽管ACR数据本身存在局限性,但我们了解它作为额外的覆盖来源所提供的规模和覆盖范围的机会--类似于机顶盒的返回路径数据(RPD),我们的大数据战略也与面板数据进行了校准,以解决类似的局限性。通过将大数据集与我们的收视数据(提供美国总体的代表性测量)相结合,我们能够显著增加我们的样本量,同时应用严格的数据科学方法来填补空白,并确保在所有网络和平台上对美国总体观众的公平代表性。
本文的一个版本最初出现在AdExchanger上。