Loncat ke konten
02_Elemen/Ikon/PanahKiri Kembali ke Wawasan
Wawasan > TV & streaming

Masalah yang tidak begitu tersembunyi dengan set data besar

6 menit dibaca | Molly Poppie, SVP Data Science, Nielsen | Oktober 2021

Akhir-akhir ini ada banyak energi dan kegembiraan di kalangan media tentang masa depan pengukuran dan janji big data. Di Nielsen, kami telah lama memahami nilai dari big data, bahkan baru bulan lalu kami mengumumkan rincian tambahan tentang bagaimana kami menambahkannya ke layanan pengukuran TV nasional kami. 

Kita juga tahu bahwa tidak ada panel yang sempurna, seperti yang telah ditunjukkan dalam beberapa bulan terakhir. 

Namun, ketika tim ilmuwan data kami mendengar beberapa klaim besar dan luas tentang big data yang akan menyelamatkan dunia dan mengatasi semua tantangan yang dirasakan dalam industri ini, sulit untuk tidak skeptis.

Hal ini dikarenakan, untuk semua nilai dan potensi yang luar biasa, kumpulan data besar yang saat ini dapat diakses oleh industri memiliki keterbatasan yang sangat nyata

Contoh terbaru yang relevan

Setelah kehilangan akses ke Portable People Meter milik Nielsen, Comscore melaporkan bahwa mereka sekarang akan menggunakan kumpulan data dari ConsumerView milik Experian untuk membantu mereka mengidentifikasi pemirsa individu untuk tujuan pengukuran. Pengumuman mereka dibingkai di media perdagangan sebagai sebuah kemajuan - bagaimanapun juga, jika data besar adalah masa depan, setiap pergeseran ke arah itu pasti merupakan hal yang baik. 

Sayangnya bagi pelanggan mereka, dan bagi konsumen, tidak demikian. 

Ada beberapa vendor identitas pihak ketiga di luar sana yang menyediakan kemampuan untuk mencocokkan set data berdasarkan informasi yang dapat diidentifikasi secara pribadi dan memberikan karakteristik demografis, baik yang dikumpulkan secara langsung maupun yang dimodelkan. 

Di Nielsen, kami secara teratur memeriksa data ini. Kami melakukannya dengan mengukur informasi secara langsung dari panel kami yang kuat untuk memvalidasi seberapa akurat set data ini dalam hal 1) pencocokan dengan rumah tangga secara tepat dan 2) melaporkan demografi dan karakteristik secara akurat. 

Apa yang biasanya kami temukan seharusnya membuat para pengiklan berhenti sejenak. 

Mayoritas kumpulan data yang ada saat ini dibangun berdasarkan informasi penagihan atau pengumpulan perilaku online, bukan profil demografis. Mereka tidak memiliki detail yang kaya tentang siapa saja yang ada dalam daftar mereka-dari usia, pendapatan, hingga ras dan etnis-seperti yang Anda dapatkan dengan panel yang kuat. Kumpulan data ini, karena dibuat dengan transfer mesin-ke-mesin, juga meningkatkan kemungkinan pemborosan dan penipuan. 

Karena itu, tingkat kepastian yang dapat mereka berikan tentang siapa yang sebenarnya tinggal di rumah tangga tertentu menjadi terbatas. Dan mereka tidak memiliki kemampuan untuk mengatakan siapa saja di dalam rumah yang menonton program tertentu pada waktu tertentu. 

Bahkan ketika Anda melakukan triangulasi data tersebut dengan sumber lain, Anda hampir pasti akan mendapatkan kesenjangan dan kesalahan yang sangat besar dalam estimasi Anda. Hal ini mungkin dapat diterima jika kasus penggunaannya adalah penargetan, tetapi data ini sendiri tidak memberikan akurasi, objektivitas, dan transparansi yang diperlukan untuk memberikan pengukuran. 

Mengapa ini penting

Jadi, apa artinya secara praktis? Nah, ini memiliki beberapa implikasi. 

Dalam kasus pergeseran Comscore dari Personal People Meter kami, yang benar-benar menempelkan mikrofon pada ~100.000 orang yang terverifikasi dalam kehidupan nyata dan melacak dengan tepat apa yang mereka tonton, 

untuk model yang menggunakan data penagihan untuk memberikan perkiraan siapa saja yang mungkin menonton program tertentu pada waktu tertentu, hasilnya akan menjadi kurang akurat mengenai siapa yang menonton apa. 

Namun, implikasi yang mungkin lebih besar adalah bahwa pergeseran ini akan membuat industri ini semakin jauh dari representasi negara yang sebenarnya. 

Kita tahu bahwa banyak dari jenis kumpulan data ini melakukan pekerjaan yang lebih baik dalam menyediakan data seputar rumah tangga ketika orang yang tinggal di sana memiliki rumah mereka sendiri dan telah berada di sana untuk waktu yang lama. Dan hal ini masuk akal. Masalahnya adalah pemilik rumah yang sudah lama tinggal di sana cenderung lebih berkulit putih, lebih makmur, dan jauh lebih tua dibandingkan dengan negara secara keseluruhan. Secara desain, kumpulan data ini kurang menghitung orang kulit hitam dan coklat, orang berpenghasilan rendah dan orang yang lebih muda, pada saat semua segmen tersebut tumbuh, bukan menyusut. 

Hal yang sama juga berlaku untuk set data yang dibangun dari data set top box, yang cenderung menghitung lebih banyak konsumen yang lebih kaya yang bersedia membayar lebih banyak untuk paket kabel dan dengan demikian secara tidak proporsional mengecualikan konsumen berpenghasilan lebih rendah yang merupakan target penting bagi banyak pemasar. 

Industri media, dengan tepat, telah menjadikan representasi yang akurat dari komunitas kulit hitam dan kulit coklat sebagai prioritas utama. Di Nielsen, rekam jejak kami dalam hal ini selama beberapa dekade belum sempurna, tetapi hari ini kami memiliki pandangan yang paling akurat dan maju tentang bangsa ini sebagaimana adanya. 

Alat pengukuran yang berasal dari data besar yang tidak didukung oleh panel yang representatif, tervalidasi, dan diaudit tidak dapat membuat klaim tersebut. Panel Nielsen dapat menargetkan banyak demografi dalam sensus dengan variabilitas 1%, tetapi opsi yang berfokus pada data besar di luar sana bahkan tidak mendekati itu. Industri ini harus terbuka dan jujur pada dirinya sendiri tentang tantangan yang dihadirkan oleh big data dalam hal representasi.

Masalah yang lebih luas

Untuk memperjelas, ini bukan hanya masalah Comscore. Ini adalah masalah dengan semua kumpulan data besar yang ada saat ini. 

Pada bulan Agustus 2020, ANA, bekerja sama dengan MRC dan Sequent Partners, menggunakan data Nielsen sebagai tolok ukur dalam sebuah studi yang dirancang untuk memahami sejauh mana audiens multikultural terwakili secara akurat dalam penargetan media. Studi ini mengamati kumpulan data pemasaran dan media berkualitas tinggi dan berusaha untuk memahami seberapa akurat penargetan audiens kulit hitam, kulit coklat, dan Asia. Temuannya cukup meresahkan, namun sama sekali tidak mengejutkan kami. 

Studi ini menemukan bahwa kumpulan data besar yang diandalkan oleh industri ini tidak mampu menargetkan komunitas-komunitas penting ini secara akurat. Sebagian karena kumpulan data tersebut tidak dirancang untuk menangkap data yang kaya tentang siapa sebenarnya konsumen ini, seperti halnya panel yang kuat, terdapat banyak kesalahan representasi dan kekurangan representasi dalam data. 

Sekarang bandingkan dengan panel Nielsen yang kuat, yang menyediakan banyak informasi yang dikumpulkan langsung dari orang-orang di kehidupan nyata, yang mewakili seluruh populasi AS. Siapa yang tinggal di rumah? Berapa usia mereka? Apa ras dan etnis yang mereka identifikasi? Siapa yang menonton televisi pada waktu tertentu? Panel Nielsen menjawab pertanyaan-pertanyaan ini. 

Sekali lagi, panel sendiri tidaklah sempurna, tetapi ada alasan mengapa industri lain, yaitu farmasi, menggunakan pendekatan yang mirip dengan panel dalam menyetujui obat. Itu karena, ketika taruhannya tinggi, tidak ada pengganti untuk orang yang benar-benar terverifikasi.  

Kita tahu bahwa banyak pemain industri yang antusias dengan janji big data, kami pun demikian. Namun sebagai sebuah industri, kami harus jujur tentang apa yang bisa dan tidak bisa diselesaikan oleh big data. Dan kami juga memahami bahwa masa depan pengukuran media adalah sebuah pendekatan yang menggabungkan jangkauan big data dengan data pribadi yang terverifikasi dari panel yang kuat.

Artikel ini pertama kali muncul di Next TV.

Lanjutkan menelusuri wawasan serupa