Les avantages des progrès de la technologie sont apparemment infinis. Nous pouvons vérifier la sécurité de nos maisons à partir de nos téléphones, recevoir des livraisons d'épicerie par drone - et même conduire des voitures qui peuvent se garer en parallèle à notre place. Nos téléviseurs sont tout aussi perfectionnés et offrent un choix de contenus apparemment infini sur un nombre toujours plus grand de plateformes et de chaînes. Pourtant, malgré les nombreuses portes que les téléviseurs intelligents vont ouvrir dans les années à venir, ils ne pourront pas, à eux seuls, fournir à l'industrie des médias une vision précise de ceux qui les utilisent.
Les téléviseurs intelligents ont envahi l'allée des téléviseurs de votre magasin de grande surface. Il est difficile de trouver aujourd'hui dans un magasin une télévision qui ne soit pas connectée à Internet. Et comme tous les appareils connectés, les téléviseurs intelligents contribuent à la prolifération croissante des données générées par les utilisateurs : Les données de reconnaissance automatique de contenu (ACR) sont la technologie utilisée par les équipementiers pour capturer le réglage des téléviseurs intelligents. Lorsqu'ils sont combinés à des informations qui détaillent un comportement représentatif au niveau de la personne, ces ensembles de données font progresser de manière significative la science de la mesure d'audience.
Compte tenu de la large adoption des téléviseurs intelligents et des données qu'ils produisent, il n'est pas surprenant qu'un grand nombre d'entreprises se tournent vers les données ACR pour mesurer les audiences. D'un point de vue purement quantitatif, l'opportunité est très attrayante. Pourtant, aussi lucrative que soit la source de données ACR, elle n'est pas suffisante en soi pour mesurer les audiences, tout simplement parce qu'il lui manque l'aspect le plus important de la mesure d'audience : les personnes. En plus de ne pas être représentatives - oumême de ne passavoir si quelqu'un regarde réellement ce qui est sur l'écran - les données ACR ont un défaut de validation critique : elles exigent que le fabricant de l'appareil fasse correspondre l'image sur l'écran avec une image de référence afin de déterminer quel contenu est affiché. Ainsi, la meilleure façon de libérer le véritable potentiel des données ACR est de les calibrer avec des données qui reflètent le véritable comportement de visualisation au niveau de la personne.
Lorsqu'elle fonctionne comme prévu, la technologie ACR surveille les images qui sont projetées sur la vitre du téléviseur et utilise ces images pour déduire le contenu affiché. Les images fournies par la technologie ACR agissent à bien des égards comme une empreinte digitale du contenu. Mais après avoir recueilli les "empreintes digitales", la technologie doit déterminer sur quel réseau ou plate-forme l'image est apparue, ainsi que le moment de son apparition. Pour ce faire, la technologie doit faire correspondre l'image à l'écran avec une image contenue dans une bibliothèque de référence gérée par le fabricant.
Il y a trois résultats possibles lorsque la technologie tente d'établir cette correspondance :
- L'image correspond à une seule entrée dans la bibliothèque de référence.
- L'image correspond à plusieurs entrées dans la bibliothèque de référence
- Une image correspondante ne se trouve pas dans la bibliothèque de référence.
Pour toutes les parties concernées, le premier résultat est le scénario idéal. Le deuxième scénario est moins idéal, et il s'accompagne d'un certain niveau de risque d'erreur de crédit, simplement en raison des diverses raisons pour lesquelles il y a des correspondances multiples (par exemple, des diffusions sur plusieurs réseaux, des diffusions répétées, des simulcast). Dans le troisième scénario, personne ne reçoit de crédit, ce qui est évidemment le scénario le moins souhaitable. La raison la plus courante de ce résultat est que le contenu a été diffusé sur un réseau que l'équipementier ne surveille pas.
Même si la comparaison d'images était une solution de mesure autonome viable, la possibilité de l'exploiter en tant que telle ne serait jamais envisageable. Comme vous pouvez l'imaginer, le coût du maintien d'une bibliothèque de chaque image de chaque événement télévisé n'est pas une mince affaire. C'est aussi une tâche qui augmentera de façon exponentielle à perpétuité. Il n'existe pas non plus de période de conservation standard pour les images.
Alors comment savons-nous que la technologie ACR fera la bonne correspondance ? Sans un mécanisme capable de remplir les blancs, nous ne le savons pas. C'est pourquoi Nielsen a investi dans des filigranes, qui sont beaucoup plus déterministes que les signatures, ainsi que dans des sauvegardes de signature pour chaque flux mesuré. Cela permet de représenter l'ensemble du contenu et de combler les lacunes associées au big data par lui-même. Une fois ces lacunes comblées, les big data provenant de sources comme ACR offrent l'avantage de l'échelle dans un paysage médiatique de plus en plus segmenté. Et lorsque nous utilisons des contrôles de pondération pour calibrer les big data avec des données de visionnage au niveau de la personne, nous sommes en mesure de voir des points de comparaison qui seraient autrement vides.
Dans une étude récente, Nielsen a cherché à comprendre dans quelle mesure ces lacunes dans les bibliothèques de référence affectent les journaux d'accord de l'ACR - la base de la mesure basée sur l'ACR. Dans une analyse des foyers communs réalisée en septembre 2021, nous avons analysé les données de nos deux partenaires fournisseurs d'ACR pour comprendre où les lacunes des bibliothèques de référence pouvaient avoir une incidence sur la mesure. Dans notre étude, nous avons examiné à la fois la concentration des sources de visionnement et les minutes visionnées à partir des sources disponibles.
Sur l'ensemble des sources de visualisation, nous avons constaté que nos partenaires fournisseurs d'ACR ne surveillent que 31% des stations disponibles. Cela signifie qu'ils ne maintiennent pas de données dans leurs bibliothèques de référence pour 69% des stations. Lorsque nous avons examiné les minutes visionnées, nous avons constaté que 23% des minutes provenaient de stations qui ne sont pas surveillées. Cela signifie que les entreprises qui n'utilisent que les données de l'ECA pour leurs mesures sous-estiment de 23 % les impressions au niveau des ménages.
Malgré les limites des données de l'ECA en elles-mêmes, nous comprenons l'opportunité d'échelle et de portée qu'elles offrent en tant que source supplémentaire de couverture - semblable à celle des données sur les voies de retour (VDR) des décodeurs, que notre stratégie de big data calibre également avec des données de panel pour répondre à des limites comparables. En intégrant les ensembles de big data à nos données d'audience, qui fournissent une mesure représentative de l'ensemble des États-Unis, nous sommes en mesure d'augmenter considérablement la taille de nos échantillons tout en appliquant des méthodologies rigoureuses de science des données pour combler les lacunes et assurer une représentation équitable de l'ensemble de l'audience américaine sur tous les réseaux et toutes les plateformes.
Une version de cet article a été initialement publiée sur AdExchanger.