
เมื่อไม่นานมานี้ วงการสื่อต่างตื่นเต้นกับอนาคตของการวัดผลและคำมั่นสัญญาของข้อมูลขนาดใหญ่เป็นอย่างมาก ที่ Nielsen เราเข้าใจถึงคุณค่าของข้อมูลขนาดใหญ่มานานแล้ว โดยเมื่อเดือนที่แล้ว เราเพิ่งประกาศรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการเพิ่มข้อมูลขนาดใหญ่ลงใน บริการวัดผลทางโทรทัศน์ระดับประเทศ ของเรา
เรารู้ดีว่าไม่มีแผงใดที่สมบูรณ์แบบ ดังที่ได้แสดงให้เห็นในช่วงไม่กี่เดือนที่ผ่านมา
แต่เมื่อทีมนักวิทยาศาสตร์ข้อมูลของเราได้ยินข้ออ้างกว้างๆ เกี่ยวกับข้อมูลขนาดใหญ่ที่จะเข้ามาช่วยและแก้ไขปัญหาที่เห็นได้ชัดในอุตสาหกรรม ก็ยากที่จะไม่รู้สึกสงสัย
นั่นเป็นเพราะว่าแม้จะมีมูลค่าและศักยภาพที่น่าทึ่ง แต่ชุดข้อมูลขนาดใหญ่ที่อุตสาหกรรมเข้าถึงได้ในปัจจุบัน กลับมีข้อจำกัดที่แท้จริงอย่างมาก
ตัวอย่างที่เกี่ยวข้องล่าสุด
หลังจากที่สูญเสียการเข้าถึง Portable People Meters ของ Nielsen บริษัท Comscore รายงานว่าบริษัทจะใช้ชุดข้อมูลจาก ConsumerView ของ Experian เพื่อช่วยระบุผู้ชมแต่ละรายเพื่อวัตถุประสงค์ในการวัดผล ประกาศของบริษัทถูกตีกรอบในสื่อการค้าว่าเป็นความก้าวหน้า เพราะท้ายที่สุดแล้ว หากข้อมูลขนาดใหญ่คืออนาคต การเปลี่ยนแปลงใดๆ ในทิศทางนั้นก็ต้องเป็นเรื่องดี
น่าเสียดายสำหรับลูกค้าของพวกเขาและผู้บริโภค นั่นไม่ใช่กรณีนั้น
มีผู้ให้บริการข้อมูลประจำตัวบุคคลที่สามจำนวนหนึ่งที่ให้บริการจับคู่ชุดข้อมูลโดยอิงจากข้อมูลที่ระบุตัวตนส่วนบุคคล และให้ข้อมูลลักษณะประชากรทั้งที่รวบรวมโดยตรงและสร้างแบบจำลอง
ที่ Nielsen เราตรวจสอบข้อมูลนี้เป็นประจำ โดยเราทำการวัดข้อมูลจากกลุ่มตัวอย่างที่มีประสิทธิภาพของเราโดยตรงเพื่อตรวจสอบว่าชุดข้อมูลเหล่านี้มีความแม่นยำเพียงใด 1) ตรงกับครัวเรือนอย่างถูกต้องและ 2) รายงานข้อมูลประชากรและลักษณะเฉพาะอย่างถูกต้อง
สิ่งที่เราพบโดยทั่วไปน่าจะทำให้ผู้โฆษณาคิดหนัก
ชุดข้อมูลส่วนใหญ่ในปัจจุบันถูกสร้างขึ้นจากข้อมูลการเรียกเก็บเงินหรือการรวบรวมข้อมูลพฤติกรรมออนไลน์ ไม่ใช่โปรไฟล์ประชากร ชุดข้อมูลเหล่านี้ไม่มีรายละเอียดที่ครอบคลุมเกี่ยวกับบุคคลในรายชื่ออย่างชัดเจน ไม่ว่าจะเป็นอายุ รายได้ เชื้อชาติ และชาติพันธุ์ เช่นเดียวกับแผงข้อมูลที่มีประสิทธิภาพ ชุดข้อมูลเหล่านี้สร้างขึ้นจากการถ่ายโอนข้อมูลระหว่างเครื่อง จึงเพิ่มโอกาสในการเกิดการสูญเปล่าและการฉ้อโกง
ด้วยเหตุนี้ ระดับความแน่นอนที่พวกเขาสามารถให้ได้เกี่ยวกับผู้ที่อาศัยอยู่ในครัวเรือนนั้นๆ จริงๆ จึงมีจำกัด และพวกเขาไม่สามารถบอกได้ว่าใครในบ้านนั้นๆ ที่กำลังรับชมรายการใดรายการหนึ่งในเวลาที่กำหนด
แม้ว่าคุณจะใช้ข้อมูลดังกล่าวร่วมกับแหล่งข้อมูลอื่น ๆ ก็ตาม แต่คุณแทบจะรับประกันได้เลยว่าจะมีช่องว่างและข้อผิดพลาดจำนวนมากในการประมาณค่าของคุณ ซึ่งอาจยอมรับได้หากกรณีการใช้งานเป็นแบบกำหนดเป้าหมาย แต่ข้อมูลนี้เพียงอย่างเดียวไม่สามารถให้ความแม่นยำ ความเป็นกลาง และความโปร่งใสที่จำเป็นต่อการวัดผลได้
เหตุใดมันจึงสำคัญ
แล้วนั่นหมายความว่าอย่างไรในทางปฏิบัติ? จริงๆ แล้วมันก็มีความหมายแฝงอยู่บ้าง
ในกรณีที่ Comscore เลิกใช้ Personal People Meters ของเรา ซึ่งติดตั้งไมโครโฟนกับผู้คนจริงราวๆ 100,000 คน ซึ่งได้รับการตรวจสอบแล้ว และติดตามสิ่งที่พวกเขากำลังรับชมอย่างแม่นยำ
หากใช้โมเดลที่ใช้ข้อมูลการเรียกเก็บเงินเพื่อคาดเดาว่าใครบ้างในที่อยู่อาศัยที่อาจรับชมรายการใดรายการหนึ่งในช่วงเวลาหนึ่ง ผลลัพธ์ที่ได้จะอ่านได้แม่นยำน้อยลงว่าใครรับชมรายการใดอยู่
แต่ผลที่ตามมาที่อาจใหญ่กว่านั้นก็คือ การเปลี่ยนแปลงครั้งนี้จะทำให้ภาคอุตสาหกรรมห่างไกลจากการนำเสนอภาพลักษณ์ที่แท้จริงของประเทศมากขึ้น
เราทราบดีว่าชุดข้อมูลประเภทนี้จำนวนมากสามารถให้ข้อมูลรอบครัวเรือนได้ดีกว่าเมื่อคนในพื้นที่เป็นเจ้าของบ้านของตนเองและอาศัยอยู่ที่นั่นเป็นเวลานาน ซึ่งก็สมเหตุสมผล ปัญหาคือเจ้าของบ้านเป็นเวลานานมักเป็นคนผิวขาว ร่ำรวย และอายุมากกว่าคนทั้งประเทศอย่างเห็นได้ชัด โดยการออกแบบชุดข้อมูลเหล่านี้จึงนับคนผิวดำและผิวน้ำตาล คนที่มีรายได้น้อย และคนหนุ่มสาวได้น้อยลง ในขณะที่กลุ่มคนเหล่านี้กำลังเพิ่มขึ้น ไม่ใช่หดตัว
เรื่องเดียวกันนี้ยังใช้ได้กับชุดข้อมูลที่สร้างขึ้นจากข้อมูลของกล่องรับสัญญาณโทรทัศน์ ซึ่งมีแนวโน้มที่จะนับรวมผู้บริโภคที่มีฐานะร่ำรวยซึ่งเต็มใจที่จะจ่ายเงินมากขึ้นสำหรับแพ็คเกจเคเบิลทีวีมากเกินไป และด้วยเหตุนี้ จึงไม่รวมผู้บริโภคที่มีรายได้น้อยกว่า ซึ่งเป็นเป้าหมายที่สำคัญสำหรับผู้ทำการตลาดจำนวนมากออกไปอย่างไม่สมส่วน
อุตสาหกรรมสื่อได้ให้ความสำคัญกับการนำเสนอชุมชนคนผิวสีอย่างถูกต้องและแม่นยำเป็นลำดับความสำคัญหลัก ผลงานที่ผ่านมาของ Nielsen ในช่วงหลายทศวรรษที่ผ่านมาไม่ได้สมบูรณ์แบบนัก แต่ในปัจจุบัน เรามีมุมมองที่แม่นยำและล้ำสมัยที่สุดเกี่ยวกับประเทศชาติอย่างแท้จริง
เครื่องมือวัดที่ได้จากข้อมูลขนาดใหญ่ซึ่งไม่ได้รับการสนับสนุนจากคณะกรรมการที่เป็นตัวแทน ซึ่งได้รับการตรวจสอบและรับรองแล้ว ไม่สามารถอ้างเช่นนั้นได้ คณะกรรมการของ Nielsen สามารถกำหนดเป้าหมายกลุ่มประชากรจำนวนมากภายในสำมะโนประชากรโดยมีความแปรปรวน 1% แต่ตัวเลือกที่เน้นข้อมูลขนาดใหญ่ที่มีอยู่นั้นไม่ใกล้เคียงกับสิ่งนั้นเลย อุตสาหกรรมจำเป็นต้องเปิดใจและซื่อสัตย์กับตัวเองเกี่ยวกับความท้าทายที่ข้อมูลขนาดใหญ่ก่อให้เกิดขึ้นเมื่อต้องนำเสนอข้อมูล
ปัญหาที่กว้างกว่า
เพื่อให้ชัดเจนขึ้น นี่ไม่ใช่ปัญหาของ Comscore เพียงเท่านั้น แต่เป็นปัญหาของชุดข้อมูลขนาดใหญ่ทั้งหมดที่มีอยู่ในปัจจุบัน
ในเดือนสิงหาคม 2020 ANA ร่วมกับ MRC และ Sequent Partners ใช้ข้อมูลของ Nielsen เป็นเกณฑ์มาตรฐานใน การศึกษาวิจัย ที่ออกแบบมาเพื่อทำความเข้าใจว่ากลุ่มเป้าหมายหลากหลายวัฒนธรรมได้รับการนำเสนอข้อมูลอย่างถูกต้องในระดับใดในการกำหนดกลุ่มเป้าหมายทางสื่อ การศึกษาวิจัยนี้พิจารณาข้อมูลการตลาดและสื่อคุณภาพสูงที่รวบรวมมารวมกัน และพยายามทำความเข้าใจว่ากลุ่มเป้าหมายเหล่านี้กำหนดกลุ่มเป้าหมายเป็นคนผิวดำ ผิวคล้ำ และเอเชียได้แม่นยำเพียงใด ผลการศึกษานี้สร้างความกังวลใจ แต่ก็ไม่น่าแปลกใจสำหรับเราเลย
การศึกษาพบว่าชุดข้อมูลขนาดใหญ่ที่อุตสาหกรรมใช้ไม่ได้มีประสิทธิภาพเพียงพอที่จะกำหนดเป้าหมายชุมชนที่สำคัญเหล่านี้ได้อย่างแม่นยำ ส่วนหนึ่งเป็นเพราะชุดข้อมูลไม่ได้รับการออกแบบมาเพื่อรวบรวมข้อมูลอันหลากหลายเกี่ยวกับตัวตนที่แท้จริงของผู้บริโภคเหล่านี้ เช่นเดียวกับกลุ่มตัวอย่างที่มีข้อมูลครบถ้วน จึงมีการบิดเบือนและนำเสนอข้อมูลไม่เพียงพออย่างแพร่หลาย
ลองเปรียบเทียบกับแผงข้อมูลอันแข็งแกร่งของ Nielsen ซึ่งให้ข้อมูลที่รวบรวมโดยตรงจากผู้คนในชีวิตจริงซึ่งเป็นตัวแทนของประชากรทั้งประเทศของสหรัฐฯ ใครอาศัยอยู่ในบ้านนั้น พวกเขาอายุเท่าไร พวกเขาเป็นคนเชื้อชาติและชาติพันธุ์ใด ใครกำลังดูโทรทัศน์ในช่วงเวลาใดเวลาหนึ่ง แผงข้อมูลของ Nielsen จะตอบคำถามเหล่านี้
แม้ว่าคณะกรรมการจะไม่ได้สมบูรณ์แบบในตัวเอง แต่ก็มีเหตุผลที่อุตสาหกรรมอื่นๆ เช่น ยา ใช้แนวทางที่คล้ายกับคณะกรรมการในการอนุมัติยา เนื่องจากเมื่อมีความเสี่ยงสูง ก็ไม่มีอะไรทดแทนบุคลากรที่ผ่านการตรวจสอบจริงได้
เราทราบดีว่าผู้เล่นในอุตสาหกรรมหลายรายต่างตื่นเต้นกับคำมั่นสัญญาของข้อมูลขนาดใหญ่ และเราก็เช่นกัน แต่ในฐานะของอุตสาหกรรม เราต้องซื่อสัตย์เกี่ยวกับสิ่งที่ข้อมูลขนาดใหญ่สามารถแก้ปัญหาได้และไม่สามารถแก้ไขได้ และเราก็เข้าใจเช่นกันว่าอนาคตของการวัดผลสื่อเป็นแนวทางที่ผสมผสานการเข้าถึงข้อมูลขนาดใหญ่กับข้อมูลส่วนบุคคลที่ได้รับการยืนยันจากกลุ่มตัวอย่างที่แข็งแกร่ง
บทความนี้ปรากฏครั้งแรกทางช่อง Next TV



