
ความจริงในการวัดไม่เคยมีความสำคัญมากเท่านี้มาก่อน ดังนั้น ความจริงจึงเป็นวาระเดียวของเรา แต่การบรรลุความจริงนั้นไม่เคยซับซ้อนเท่านี้มาก่อน แม้ว่าหลายคนจะมองว่าข้อมูลขนาดใหญ่เป็นยารักษาโรคสำหรับการวัดในโลกที่เต็มไปด้วยดิจิทัล แต่เราก็รู้ว่ามันไม่ง่ายอย่างนั้น
แผงข้อมูล ของ Nielsen เป็นรากฐานของการวัดระดับบุคคลมาหลายทศวรรษและยังคงเป็นเช่นนั้นในปัจจุบัน อย่างไรก็ตาม การเติบโตของข้อมูลขนาดใหญ่ไม่สามารถละเลยได้ในฐานะแหล่งข้อมูลอันมีค่า แต่ข้อมูลขนาดใหญ่เพียงอย่างเดียวไม่เหมาะสำหรับการวัดผลแบบตัวแทน ลองนึกถึงตอนที่คุณเปลี่ยนช่องทีวี การเปลี่ยนแปลงนั้นกลายเป็นส่วนหนึ่งของข้อมูลขนาดใหญ่ แต่ไม่มีบันทึกว่าใครเป็นผู้ทำการเปลี่ยนแปลงหรือใครเป็นพยานในการเปลี่ยนแปลงนั้น
เพื่อเน้นย้ำข้อบกพร่องของข้อมูลขนาดใหญ่จากมุมมองของการวัดผล เราได้ดำเนิน การวิเคราะห์ในสหรัฐอเมริกาเมื่อต้นปีนี้ โดยเปรียบเทียบข้อมูลกล่องรับสัญญาณดิจิทัลกับข้อมูลกล่องรับสัญญาณดิจิทัลที่เราปรับเทียบด้วยข้อมูลแผง Nielsen การวิเคราะห์พบว่าข้อมูลที่ไม่ได้รับการปรับเทียบนั้นมีความลำเอียงโดยเนื้อแท้และแสดงถึงผู้ชมกลุ่มน้อยไม่เพียงพอ
อย่างไรก็ตาม นั่นไม่ได้หมายความว่าข้อมูลขนาดใหญ่ไม่มีค่า ตรงกันข้ามเลย แต่ข้อมูลจะต้องได้รับการวางรากฐานบนชุดความจริงพื้นฐาน นั่นคือจุดที่แผงข้อมูลและปัญญาประดิษฐ์ (AI) ของเราเข้ามามีบทบาท ข้อมูลแผงข้อมูลของเราซึ่งเป็นกุญแจสำคัญในการวัดระดับบุคคล เป็นชุดความจริงที่สมบูรณ์แบบสำหรับการฝึกอบรมข้อมูลขนาดใหญ่
เราใช้ข้อมูลขนาดใหญ่เพื่อขยายขีดความสามารถในการวัดผลของเราอย่างมากโดยยังคงรักษาคุณภาพและความเป็นตัวแทนไว้ได้ ปัจจุบัน AI เป็นส่วนสำคัญในวิธีการวัดผลของเรา ตัวอย่างเช่น AI มีบทบาทสำคัญในการพัฒนาขีดความสามารถในการวัดผลที่เพิ่มขึ้นสำหรับตลาดทีวีในท้องถิ่น ซึ่งผสมผสานขนาดของข้อมูลขนาดใหญ่ (ข้อมูลเส้นทางกลับ {RPD} จากเครื่องรับโทรทัศน์) เข้ากับข้อมูลแผงในตลาดที่เป็นตัวแทนอย่างสมบูรณ์
ในขณะที่เราพยายามรวม RPD เข้ากับการวัดในระดับท้องถิ่น เราได้ระบุการใช้งาน AI ที่สำคัญสี่ประการ
การจดจำรูปแบบข้อมูล
ขณะที่เราค้นคว้าวิธีผสาน RPD เข้ากับการวัดของเรา เราได้ระบุข้อจำกัดที่เกี่ยวข้องกับ RPD ผ่านสิ่งที่เราเรียกว่า "การวิเคราะห์บ้านทั่วไป" สำหรับการวิเคราะห์เหล่านี้ ซึ่งยังคงดำเนินการอยู่ในปัจจุบัน เราเปรียบเทียบข้อมูลการปรับจูนจากมิเตอร์ Nielsen กับข้อมูลการปรับจูน RPD การวิเคราะห์เหล่านี้ครอบคลุมบ้านมากกว่า 5,000 หลัง (ทีวี 12,000 เครื่อง) ในแต่ละเดือน และพบว่า RPD ขาดการปรับจูนบางส่วน
เพื่อแก้ไขข้อบกพร่องนี้ เราได้พัฒนาเทคนิคที่อยู่ระหว่างการจดสิทธิบัตรซึ่งใช้ตัวจำแนกประเภทเพื่อจดจำรูปแบบที่เกี่ยวข้องกับการปรับแต่งที่ขาดหายไปในบ้าน RPD จากนั้นอัลกอริทึม AI จะลบบ้านเหล่านี้ออกจากการใช้งานในการวัด
การทราบเวลาที่กล่องรับสัญญาณทีวีเปิดอยู่และเวลาที่ทีวีปิดอยู่
การวิเคราะห์บ้านทั่วไปของ Nielsen วิเคราะห์เวลาการปรับจูนมากกว่า 77 ล้านนาทีในแต่ละเดือน ซึ่งให้ข้อมูลเชิงลึกอันทรงพลัง อย่างไรก็ตาม การปรับจูนดังกล่าวไม่แม่นยำเสมอไป ตัวอย่างเช่น ผู้คนไม่ได้ปิดกล่องรับสัญญาณโทรทัศน์เสมอไปเมื่อปิดทีวี RPD นำเสนอสถานการณ์เหล่านี้ว่าเป็นการดูทีวีแม้ว่าจะไม่มีใครดูอยู่ก็ตาม
เราสามารถเอาชนะข้อจำกัดนี้ได้โดยการใช้ตัวจำแนกการเรียนรู้เชิงลึกเพื่อระบุสถานการณ์ที่เซ็ตท็อปบ็อกซ์เปิดอยู่ในขณะที่ทีวีปิดอยู่ จากนั้นอัลกอริทึมจะลบการปรับจูนที่ไม่ถูกต้องออกจาก RPD
การระบุลักษณะครัวเรือนและข้อมูลประชากรจาก RPD
RPD ไม่มีชื่อและไม่มีหน้าตา และไม่สามารถให้ข้อมูลประชากรได้ ข้อมูลประชากรมีความสำคัญอย่างยิ่งในการแสดงข้อมูลทุกกลุ่มของประชากรได้อย่างถูกต้อง และยิ่งไปกว่านั้น การวัดผลที่แม่นยำยังหมายถึงความสามารถในการวัดจำนวนคน ไม่ใช่แค่ครัวเรือนเท่านั้น
เพื่อปลดล็อกข้อมูลที่มีประสิทธิภาพภายในบ้าน RPD เราจึงปรับเทียบ RPD ด้วยลักษณะที่ทราบ ข้อมูลประชากร และข้อมูลการปรับแต่งจากบ้านที่วัดโดย Nielsen มากกว่า 45,000 หลัง และลักษณะและข้อมูลประชากรที่กำหนดโดยบุคคลที่สาม จากนั้นเราจึงเพิ่มอินพุตเหล่านี้ลงในเครือข่ายประสาทเทียมแบบวนซ้ำที่รอการจดสิทธิบัตรและเทคนิคการเขียนโปรแกรมจำนวนเต็มแบบผสมที่ระบุลักษณะและข้อมูลประชากรของบ้าน RPD ได้อย่างแม่นยำ อัลกอริทึม AI นี้ช่วยให้เราสามารถรายงานลักษณะประชากรของบุคคลและครัวเรือนได้อย่างแม่นยำ
การกำหนดตำแหน่งห้องสำหรับเซ็ตท็อปบ็อกซ์
ข้อมูลของ Nielsen Panel ให้ข้อมูลผู้ชมและสถานที่รับชม แต่ RPD ไม่ได้ให้ข้อมูลดังกล่าว อย่างไรก็ตาม เราสามารถรับข้อมูลดังกล่าวจาก RPD ได้โดยใช้ AI เราใช้ระเบียบวิธีที่ได้รับการพิสูจน์แล้วทางวิทยาศาสตร์เพื่อระบุว่าสมาชิกในครัวเรือนคนใดกำลังรับชมและกำลังรับชมอยู่ที่ใดภายในบ้าน
การวิจัยพบว่าตำแหน่งของห้องเป็นปัจจัยสำคัญอย่างหนึ่งในการทำนายว่าสมาชิกในครัวเรือนคนใดจะเป็นผู้ชมรายการ ดังนั้นเราจึงใช้ตัวจำแนกประเภทเพื่อระบุตำแหน่งของห้องของกล่องรับสัญญาณโทรทัศน์ที่ทำการจูนสัญญาณในบ้านที่มีระบบ RPD ด้วยวิธีนี้ เราจึงสามารถใช้ตัวแปรนี้ในการกำหนดผู้ชมได้
ด้วยข้อมูลที่มีอยู่มากมายในปัจจุบัน จึงเกิดความน่าดึงดูดใจที่จะมองข้อมูลขนาดใหญ่ผ่านแว่นตาสีชมพู อย่างไรก็ตาม หากไม่มีการเชื่อมต่อกับบุคคล ข้อมูลขนาดใหญ่ก็จะไม่แม่นยำเลย เราพบว่า AI เป็นวิธีที่มีประสิทธิภาพในการแก้ไขอคติในข้อมูลขนาดใหญ่ และเรายินดีที่จะนำเสนอนวัตกรรมนี้ให้กับลูกค้า นวัตกรรมนี้ได้รับประโยชน์จากทั้งข้อมูลจำนวนมากที่แหล่งข้อมูลขนาดใหญ่ให้มาและชุดข้อมูลจริงที่ช่วยให้ลูกค้าสามารถวางแผน เปิดใช้งาน และวัดผลตามข้อมูลที่มีความเป็นตัวแทนและถูกต้อง
บทความนี้เผยแพร่ครั้งแรกบน Medium



