Pour l'industrie des médias, la période comprise entre mars et mai est une période d'effervescence. À travers les nombreux événements qui couvrent le paysage médiatique, qui ne sont plus liés à des plateformes et des technologies individuelles, le marché du contenu en expansion présente à la fois une richesse d'opportunités et une étendue d'informations pour les acheteurs et les vendeurs de publicité à naviguer, en particulier au milieu des conversations croissantes sur le big data pour l'évaluation.
Pour les annonceurs, les chiffres sont essentiels à cette période de l'année. Et comme la consommation de télévision diminue au fur et à mesure que l'engagement numérique augmente, ils prennent encore plus d'importance. Quelle importance ? Selon une étude d' Ampere Analysis, les dépenses totales consacrées au contenu en 2021 s'élèveront à environ 220 milliards de dollars, sous l'impulsion de Netflix, le géant du streaming. Sachant que les Américains ont visionné en streaming près de 15 millions d'années de vidéo l'année dernière, les annonceurs se mobilisent, car les dépenses publicitaires numériques mondiales ont augmenté de plus de 29 % en 2021 pour dépasser les 491 milliards de dollars.
De plus, les consommateurs n'ont pas l'intention de changer la trajectoire du secteur de la diffusion en continu, puisque 93 % des abonnés à ce service déclarent vouloir augmenter leur consommation au cours de l'année à venir. Cela ne signifie pas pour autant que les contenus télévisuels traditionnels ne sont plus d'actualité. Bien au contraire, l'adulte moyen passe plus de deux fois plus de temps par jour à regarder la télévision en direct qu'à regarder la télévision connectée (CTV).
L'abondance croissante de contenu offre un choix de plus en plus vaste aux consommateurs, mais la myriade de plateformes, d'appareils et de services peut poser des problèmes de mesure aux annonceurs. En outre, l'explosion du choix n'a pas créé plus de temps pour s'engager avec le contenu, et n'a pas non plus créé plus de personnes. Mais le big data, y compris celui qui provient des téléviseurs intelligents (ACR) et des boîtiers de câblodistribution (RPD), a une façon de suggérer le contraire. Les données provenant des boîtiers de câblodistribution et des téléviseurs intelligents ne donnent pas non plus beaucoup d'indications sur l'activité de diffusion en continu : Les boîtiers de câblodistribution, par définition, fournissent des données sur la télévision traditionnelle, et l'ACR s'éteint souvent lorsque le public utilise des applications natives, y compris Netflix.
Outre le fait qu'elles n'ont jamais été conçues pour être utilisées à des fins de mesure, les données massives ne reflètent pas les personnes réelles. Il ne faut pas se méprendre sur la valeur du RPD et de l'ACR, car ils fournissent une échelle de mesure, mais les big data reflètent des appareils, pas des personnes réelles. Les données en elles-mêmes ne peuvent pas vous dire qui regarde et qui ne regarde pas, ce qui est un besoin fondamental pour les annonceurs. Et lorsque les personnes sont exclues de l'équation, les chiffres ne s'additionnent tout simplement pas.
Prenons par exemple les données ACR, qui identifient les images sur les écrans des téléviseurs intelligents. Ces données peuvent être très utiles pour mesurer l'audience, mais elles ne font rien d'autre qu'identifier ce qui se trouve sur un écran. Les données RPD sont similaires, mais elles ne permettent même pas de vérifier qu'un téléviseur est allumé. C'est pourquoi un quart de toutes les impressions de décodeurs proviennent de téléviseurs qui ne sont même pas allumés.
En plus de ne pas savoir qui utilise un appareil ou un écran, le big data est intrinsèquement biaisé, et ce biais dépend du type de données. Pour que les big data représentent réellement la population américaine, il faudrait que tous les foyers équipés d'un téléviseur possèdent exactement le même appareil et accèdent à la programmation par le même flux de données. C'est pourquoi tous les ensembles de big data doivent être mis à niveau - calibrés - avec des panels basés sur des personnes qui reflètent la diversité de la population américaine.
Il est important de noter que la Fédération mondiale des annonceurs, l'Association of National Advertisers et les organisations comparables dans plus de 30 autres pays ont unanimement déclaré que le futur système de mesure d'audience pour les médias sur écran doit être une combinaison de panels de qualité et de données massives (big data).
En l'absence de données de panel, les mesures ne tiennent pas compte de la diversité. Non seulement nous savons que tous les foyers TV n'auront jamais accès au même contenu sur les mêmes appareils, mais nous savons aussi que la composition des foyers est aussi variée que le tissu du pays qui contient les foyers TV. C'est là que les mesures basées sur les big data manquent le coche, et ce de manière significative.
Par exemple, les Hispaniques représentent un peu moins de 20 % de la population américaine, mais le big data sous-estime considérablement ce public, ainsi que beaucoup d'autres. Mais lorsque la mesure est basée sur le seul RPD, les analyses de Nielsen ont révélé que les foyers hispaniques étaient sous-représentés de 30 %. Pour mettre cela en perspective, considérons ceci : Le recensement américain de 2020 a déterminé que la population hispanique s'élevait à un peu plus de 62 millions de personnes. Si la moitié de cette population regarde la télévision à un moment donné et que les annonceurs utilisent les données RPD pour la mesure, les annonceurs pourraient toucher 9 millions de personnes de plus qu'ils ne le pensent.
Il est important de noter que la sous-représentation de 30 % est une moyenne. Au niveau des programmes, le big data peut entraîner une sous-représentation ou une surreprésentation dans des proportions bien plus importantes, tant pour la population générale que pour les publics diversifiés. Par exemple, une étude de Nielsen sur les écarts entre la mesure du big data et sa mesure de référence basée sur des panels a révélé que la mesure RPD surestimait de 69 % le nombre total d'impressions aux États-Unis pour un programme diffusé aux heures de grande écoute. Comparativement, la mesure ACR sous-évalue le total de 12 %. Pour un événement sportif, la mesure RPD a sous-estimé l'audience hispanique de 47 %, tandis que les données ACR ont surestimé cette même audience de 12 %.
Pour les annonceurs, ces écarts de mesure peuvent être coûteux. L'offre croissante de nouvelles sources de données ajoute toutefois de la complexité à la mesure, en particulier lorsqu'elle n'est pas liée à des personnes réelles. Les éditeurs et les annonceurs voudront toujours avoir la plus grande portée possible, mais certainement pas sans la rigueur analytique nécessaire pour la valider.
À l'heure où le linéaire et le numérique convergent, les sources de données massives (big data) sont des intrants essentiels pour la mesure. Mais elles ne sont pas fiables en tant que sources de mesure en soi. Comme les consommateurs utilisent de plus en plus d'appareils et de canaux, il sera facile de montrer du doigt les données qui font état d'un engagement potentiellement surévalué. Les annonceurs apprécieraient certainement les tailles d'audience que de nombreuses audiences alternatives suggèrent, mais s'ils placent leurs achats publicitaires par rapport à ces chiffres, ils paieront en fin de compte pour des chiffres qui ne reflètent pas les personnes réelles.