Para a indústria da mídia, o período entre março e maio é tempo de ir. Através dos muitos eventos iniciais que abrangem o cenário da mídia, que não estão mais vinculados a plataformas e tecnologias individuais, o mercado de conteúdo em expansão apresenta tanto uma riqueza de oportunidades quanto uma expansão de informações para compradores e vendedores de anúncios para navegar, especialmente em meio às crescentes conversas sobre grandes dados para medição.
Para os anunciantes, os números são críticos nesta época do ano. E como o consumo de TV se fragmenta em meio ao aumento do envolvimento digital, eles assumem uma importância ainda maior. Qual a importância? Um estudo da Ampere Analysis descobriu que o total gasto com conteúdo em 2021 totalizou cerca de US$220 bilhões, liderado pela central de streaming Netflix. E os anunciantes, sabendo que os americanos transmitiram quase 15 milhões de anos de vídeo no ano passado, estão se recuperando, já que os gastos com anúncios digitais em todo o mundo aumentaram mais de 29% em 2021 para eclipsar 491 bilhões de dólares.
Além disso, os consumidores não têm planos de mudar a trajetória da indústria de streaming, já que 93% dos assinantes de streaming dizem que planejam aumentar sua utilização durante o próximo ano. Isso não significa, entretanto, que o conteúdo tradicional da TV esteja fora de cogitação. Muito pelo contrário, já que o adulto médio passa mais do dobro do tempo por dia com TV ao vivo do que com conteúdo de TV conectada (CTV).
A crescente abundância de conteúdo apresenta uma crescente riqueza de escolha para os consumidores, mas as inúmeras plataformas, dispositivos e serviços podem apresentar desafios de medição para os anunciantes. Além disso, a explosão da escolha não criou mais tempo para se envolver com o conteúdo, nem criou mais pessoas. Mas os grandes dados, incluindo os que provêm das TVs inteligentes (ACR) e das caixas de cabos (RPD), têm uma maneira de sugerir o contrário. Os dados das caixas de TV a cabo e das TVs inteligentes também fornecem pouca visão da atividade de streaming: As caixas de cabos, por definição, fornecem dados tradicionais de TV, e o ACR frequentemente se desliga quando o público usa aplicativos nativos, incluindo o Netflix.
Além de nunca serem destinados a serem usados para medição, os grandes dados não refletem as pessoas reais. Não há engano no valor de RPD e ACR, pois eles fornecem escala para medição, mas grandes dados são reflexos de dispositivos, não de pessoas reais. Os dados por si só não podem dizer quem está assistindo e quem não está - o que é uma necessidade fundamental para os anunciantes. E quando as pessoas são removidas da equação, os números simplesmente não se somam.
Tomemos como exemplo os dados ACR, que identificam as imagens nas telas das TVs inteligentes. Estes dados podem ser muito úteis na medição da audiência, mas por si só, nada mais fazem do que identificar o que está em uma tela. Os dados RPD são semelhantes, mas falta até mesmo a capacidade de verificar se um aparelho de TV está ligado. É por isso que um quarto de todas as impressões do set-top-box vem de televisores que não estão nem mesmo ligados.
Além de não saber quem está usando um dispositivo ou uma tela, os grandes dados são inerentemente tendenciosos, e o viés depende do tipo de dados. Para que os grandes dados representem verdadeiramente a população dos EUA, todos os lares de TV precisariam ter exatamente o mesmo aparelho de TV e acessar a programação exatamente através do mesmo fluxo de dados. É por isso que todos os grandes conjuntos de dados precisam ser calibrados por níveis - com painéis baseados em pessoas que reflitam a diversidade da população dos EUA.
É importante ressaltar que a Federação Mundial de Anunciantes, a Associação de Anunciantes Nacionais e as organizações comparáveis em mais de 30 outras nações declararam unanimemente que o futuro sistema de medição de audiência para mídia de tela deve ser uma combinação de painel de qualidade e grandes dados.
Sem os dados do painel, a medição não captura a diversidade. Não só sabemos que todas as residências com TV nunca terão acesso ao mesmo conteúdo nos mesmos aparelhos, como também sabemos que a maquiagem doméstica é tão variada quanto o tecido do país que contém as residências com TV. É aí que as grandes medições baseadas em dados não captam a marca de forma significativa.
Por exemplo, os hispânicos representam pouco menos de 20% da população dos EUA, mas grandes dados subestimam significativamente este público, juntamente com muitos outros. Mas quando a medição é baseada apenas na RPD, as análises da Nielsen descobriram que ela representa 30% menos do que os lares hispânicos. Para colocar isso em perspectiva, considere isto: O Censo americano de 2020 determinou que a população hispânica era pouco mais de 62 milhões de hispânicos. Se metade dessa população estiver assistindo TV em um determinado momento e os anunciantes aproveitam os dados da RPD para medir, os anunciantes poderiam estar alcançando mais 9 milhões de pessoas do que eles saberiam.
É importante destacar que a subrepresentação de 30% é uma média. Em nível de programa, grandes dados podem ser sub-representados e super-representados por margens muito maiores, tanto para a população em geral como para públicos diversos. Por exemplo, um estudo da Nielsen sobre as variações entre a medição de grandes dados e sua medição baseada em painel de ouro padrão constatou que a medição RPD superou em 69% o total de impressões dos EUA para um programa de horário nobre. Comparativamente, a medição ACR subavaliou o total em 12%. Para um evento esportivo, a medição RPD subestimou o público hispânico em 47%, enquanto os dados do ACR subestimaram o mesmo público em 12%.
Para os anunciantes, estas variações de medição podem ser dispendiosas. O crescente fornecimento de novas fontes de dados, no entanto, acrescenta complexidade à medição, especialmente quando ela pode não estar conectada a pessoas reais. Editores e anunciantes sempre quererão o maior alcance possível, mas certamente não sem o rigor analítico necessário para validá-la.
Como as fontes de dados lineares e digitais convergem, as grandes fontes de dados são entradas críticas para a medição. Mas elas não são confiáveis como fontes de medição por si só. medida que os consumidores se envolvem com mais dispositivos e mais canais, será fácil apontar para dados que alegam um envolvimento potencialmente super-inflado. Os anunciantes certamente gostariam de receber os tamanhos de audiência que muitos públicos alternativos sugerem, mas se eles colocarem suas compras de anúncios contra esses números, eles acabarão pagando por números que não são refletivos de pessoas reais.