跳到内容
02_Elements/Icons/ArrowLeft 返回洞察力
洞察力>观众

人工智能是大数据和个人层面测量之间的联系

4分钟阅读 | 尼尔森全球媒体首席数据和研究官Mainak Mazumdar | 2019年10月

计量方面的真相从未像今天这样重要。因此,真理是我们唯一的议程。但是,获得真相从来没有像今天这样复杂。虽然许多人认为大数据是在一个数字丰富的世界中测量的万能药,但我们知道它并不那么简单。

几十年来,尼尔森的 小组一直是个人层面测量的基础,今天也是如此。然而,大数据的发展作为一个有价值的信息来源,是不能被忽视的。但是,仅靠大数据并不适合进行代表性测量。想一想你什么时候改变了电视的频道。这一变化成为大数据的一部分,但没有记录谁做了这一变化或谁目睹了这一变化。

为了从测量的角度强调大数据的缺点,我们 今年早些时候在美国进行了一项 分析,将机顶盒数据与我们用尼尔森面板数据校准的机顶盒数据进行了比较。该分析发现,未经校准的数据有内在的偏见,对少数民族观众的反映不足。

然而,这并不是说,大数据没有价值。恰恰相反。但它确实需要以一个基本的真理集为基础。这就是我们的面板和人工智能(AI)发挥作用的地方。我们的小组数据--个人层面测量的关键--是训练大数据的完美真相集。

通过人工智能的应用,我们利用大数据极大地拓宽了我们的测量能力,同时保持了质量和代表性。今天,人工智能是我们测量方法的组成部分。例如,它在我们为本地电视市场开发增强的测量能力中发挥了关键作用,它结合了大数据的规模(来自电视机的返回路径数据{RPD})和具有充分代表性的市场面板数据。

当我们寻求将RPD纳入我们的地方测量时,我们确定了人工智能的四个关键用途。

识别数据模式

当我们研究如何将RPD整合到我们的测量中时,我们通过我们所说的 "普通家庭分析 "发现了与RPD相关的限制。在这些分析中,我们将尼尔森仪表的调谐数据与RPD的调谐数据进行比较,这种分析一直持续到今天。这些分析每个月覆盖5000多个家庭(12000台电视),并发现RPD错过了一些调谐。

为了解决这一缺陷,我们开发了一种正在申请专利的技术,使用分类器来识别与RPD住宅中缺失的调谐相关的模式。从那里,人工智能算法将这些家庭从测量中移除。

了解机顶盒何时开启,电视机何时关闭

尼尔森的普通家庭分析分析了特定月份内超过7700万分钟的调频,这提供了强大的洞察力。然而,这种调整并不总是准确的。例如,人们并不总是在关闭电视机的时候关闭机顶盒。RPD将这些情况显示为电视观看,即使没有人在看。

我们可以通过采用深度学习分类器来识别机顶盒开启而电视关闭的情况来克服这一限制。然后,该算法将无效的调谐从RPD中删除。

从RPD中识别家庭特征和人口统计信息

RPD是无名的,不露面的,它不能提供人口信息。人口信息对于正确代表人口的所有部分至关重要。除此之外,准确的测量意味着能够测量人,而不仅仅是家庭。

因此,为了释放RPD家庭中的强大信息,我们用来自超过45,000个尼尔森计量家庭的已知特征、人口统计学和调谐信息以及第三方分配的特征和人口统计学对RPD进行校准。然后,我们将这些输入添加到正在申请专利的递归神经网络和混合整数编程技术中,以准确识别RPD家庭的特征和人口统计。这种人工智能算法使我们能够准确地报告个人和家庭的人口统计特征。 

确定机顶盒室的位置

尼尔森小组信息提供观众信息和观看地点。RPD不提供这两种信息。然而,我们可以通过人工智能从RPD获得这些信息。我们使用一种经过科学验证的方法来确定哪个家庭成员正在观看,以及在家庭中哪里观看。

研究发现,房间位置是预测哪些家庭成员是观看对象的关键因素之一。因此,我们使用一个分类器来识别在RPD家庭中发生调谐的机顶盒的房间位置。这样一来,我们就可以在观众分配过程中使用这个变量。

今天有这么多的信息,很容易让人戴上玫瑰色的眼镜来看待大数据。然而,如果没有与人的联系,大数据是远远不够准确的。我们发现人工智能是解决大数据中的偏见的有力方法,并高兴地将创新带给客户。这种创新既得益于大数据源提供的丰富信息,也得益于确保他们能够根据具有代表性和准确性的数据进行规划、激活和测量的真相集。

这篇文章首先出现在Medium上。