Últimamente hay mucha energía y entusiasmo en los círculos de los medios de comunicación sobre el futuro de la medición y la promesa de los macrodatos. En Nielsen, hace tiempo que comprendemos el valor de los macrodatos; de hecho, el mes pasado anunciamos detalles adicionales sobre cómo los estamos incorporando a nuestro servicio nacional de medición de televisión.
También sabemos que ningún panel es perfecto, como han demostrado los últimos meses.
Pero cuando nuestros equipos de científicos de datos escuchan algunas de las grandes afirmaciones de que los macrodatos vendrán a salvar el día y a solucionar todos los retos percibidos en el sector, es difícil no mostrarse escéptico.
Esto se debe a que, a pesar de todo su valor y asombroso potencial, los grandes conjuntos de datos a los que la industria tiene acceso actualmente tienen limitaciones muy reales.
Un ejemplo reciente
Tras perder el acceso a los Portable People Meters de Nielsen, Comscore informó de que ahora utilizará conjuntos de datos de ConsumerView de Experian para ayudarles a identificar a los espectadores individuales con fines de medición. En la prensa especializada, el anuncio se consideró un avance, ya que, si el big data es el futuro, cualquier cambio en esa dirección debe ser positivo.
Por desgracia para sus clientes, y para los consumidores, no es así.
Hay un puñado de proveedores de identidad de terceros que ofrecen la posibilidad de cotejar conjuntos de datos basados en información personal identificable y proporcionan características demográficas, tanto recogidas directamente como modeladas.
En Nielsen comprobamos estos datos con regularidad. Lo hacemos midiendo directamente la información de nuestros sólidos paneles para validar el grado de precisión de estos conjuntos de datos en 1) la correspondencia correcta con un hogar y 2) la información precisa sobre datos demográficos y características.
Lo que solemos encontrar debería hacer reflexionar a los anunciantes.
La mayoría de los conjuntos de datos que existen en la actualidad se basan en información de facturación o recopilación de comportamientos en línea, no en perfiles demográficos. No disponen de información detallada sobre quiénes son exactamente las personas que figuran en sus listas -desde la edad hasta los ingresos, pasando por la raza y el origen étnico-, como sí ocurre con un panel sólido. Estos conjuntos de datos, al crearse mediante transferencias de máquina a máquina, también aumentan la posibilidad de despilfarro y fraude.
Por eso, el nivel de certeza que pueden ofrecer sobre quién vive realmente en un hogar determinado es limitado. Y no tienen capacidad para decir quién, dentro de un hogar determinado, está viendo un programa concreto a una hora específica.
Incluso cuando se triangulan esos datos con otras fuentes, es casi seguro que habrá grandes lagunas y errores en las estimaciones. Esto puede ser aceptable si el caso de uso es la orientación, pero estos datos por sí solos no proporcionan la precisión, objetividad y transparencia necesarias para ofrecer una medición.
Por qué es importante
¿Qué significa esto en la práctica? Bueno, tiene algunas implicaciones.
En el caso de Comscore, nos alejamos de nuestros Personal People Meters, que colocan micrófonos a unas 100.000 personas reales y verificadas y hacen un seguimiento exacto de lo que están viendo,
a un modelo que utiliza los datos de facturación para proporcionar estimaciones de quién dentro de una vivienda podría estar viendo un programa determinado en un momento dado, el resultado será una lectura menos precisa de quién está viendo qué.
Pero la implicación posiblemente mayor es que este cambio va a alejar a la industria de captar una verdadera representación del país.
Sabemos que muchos de estos tipos de conjuntos de datos proporcionan mejor información sobre los hogares cuando las personas que viven en ellos son propietarios de su vivienda y llevan mucho tiempo en ella. Y eso es lógico. El problema es que los propietarios de vivienda de larga duración suelen ser más blancos, más acomodados y bastante mayores que el conjunto del país. Por su propio diseño, estos conjuntos de datos no tienen en cuenta a los negros y morenos, a las personas con ingresos más bajos y a los más jóvenes, en un momento en que todos esos segmentos están creciendo, no disminuyendo.
Lo mismo ocurre con los conjuntos de datos elaborados a partir de los datos de los descodificadores, que tienden a contar en exceso a los consumidores más acomodados que están dispuestos a pagar más por los paquetes de cable y, por tanto, excluyen de forma desproporcionada a los consumidores con ingresos más bajos, que son objetivos importantes para muchos vendedores.
La industria de los medios de comunicación ha hecho, con razón, de la representación exacta de las comunidades negra y marrón una prioridad central. En Nielsen, nuestro historial en este sentido desde hace décadas no ha sido perfecto, pero hoy tenemos la visión más precisa y avanzada de la nación tal y como es en realidad.
Las herramientas de medición derivadas de los macrodatos que no están respaldadas por un panel representativo, validado y auditado no pueden hacer esa afirmación. Los paneles de Nielsen pueden dirigirse a muchos grupos demográficos dentro del censo con una variabilidad del 1%, pero las opciones basadas en big data que existen ni siquiera se acercan a eso. El sector tiene que ser abierto y honesto consigo mismo sobre los retos que plantean los macrodatos en lo que respecta a la representación.
Un problema más amplio
Para que quede claro, no se trata sólo de un problema de Comscore. Es un problema con todos los grandes conjuntos de datos que existen actualmente.
En agosto de 2020, la ANA, en colaboración con el MRC y Sequent Partners, utilizó los datos de Nielsen como referencia en un estudio diseñado para comprender hasta qué punto las audiencias multiculturales estaban siendo representadas con precisión en la orientación de los medios de comunicación. El estudio analizó una colección agregada de datos de alta calidad sobre marketing y medios de comunicación y trató de entender con qué precisión se dirigía a las audiencias negra, parda y asiática. Los resultados fueron preocupantes, pero no nos sorprendieron en absoluto.
El estudio reveló que los grandes conjuntos de datos en los que se basa el sector no estaban a la altura de la tarea de dirigirse con precisión a estas comunidades críticas. En parte porque los conjuntos de datos no estaban diseñados para captar datos ricos sobre quiénes son realmente estos consumidores, como lo están los paneles robustos, había una representación errónea y una infrarrepresentación rampantes en los datos.
Ahora contrasta eso con los sólidos paneles de Nielsen, que proporcionan una gran cantidad de información recopilada directamente de personas de la vida real, representativas de toda la población estadounidense. ¿Quién vive en el hogar? ¿Qué edad tienen? ¿Con qué raza y etnia se identifican? ¿Quién está viendo la televisión en un momento dado? El panel de Nielsen responde a estas preguntas.
Una vez más, los paneles por sí solos no son perfectos, pero hay una razón por la que otras industrias, como la farmacéutica, utilizan enfoques similares a los paneles para aprobar medicamentos. Esto se debe a que, cuando hay mucho en juego, no hay sustituto para las personas reales y verificadas.
Sabemos que muchos agentes del sector están entusiasmados con la promesa de los macrodatos, y nosotros también. Pero, como sector, debemos ser honestos sobre lo que los macrodatos pueden y no pueden resolver. Y nosotros también entendemos que el futuro de la medición de medios pasa por un enfoque que combine el alcance de los macrodatos con los datos personales verificados de paneles sólidos.
Este artículo apareció originalmente en Next TV.