02_องค์ประกอบ/ไอคอน/ลูกศรซ้าย ย้อนกลับไปที่ข้อมูลเชิงลึก

ข้อมูลเชิงลึก > สื่อ

การใช้การเรียนรู้ของเครื่องจักรเพื่อคาดการณ์เรตติ้งทีวีในอนาคตในภูมิทัศน์สื่อที่กำลังเปลี่ยนแปลง

อ่าน 5 นาที | Jingsong Cui รองประธาน และ Scott Sereday ผู้จัดการ Data Science, Nielsen | ตุลาคม 2016

บริษัทสื่อและผู้โฆษณาพึ่งพาเรตติ้งทีวีทุกวันเพื่อวัดความสำเร็จของรายการทีวี ตรวจสอบว่าขนาดและองค์ประกอบของผู้ชมสอดคล้องกับเป้าหมายการซื้อสื่อหรือไม่ และชดเชยในกรณีที่ตัวเลขไม่เป็นไปตามเป้าหมาย จากมุมมองดังกล่าว เรตติ้งทีวีเป็นตัวชี้วัดที่วัดการรับชมทีวีในอดีตหรืออย่างดีก็ปัจจุบัน

บริษัทสื่อยังใช้เรตติ้งเพื่อทำนายอนาคตอีกด้วย เรตติ้งช่วยกำหนดความคาดหวังและส่งผลต่อการตัดสินใจเลือกโปรแกรมจากซีซันหนึ่งไปสู่อีกซีซันหนึ่ง นอกจากนี้ยังช่วยกำหนดอัตราค่าโฆษณาล่วงหน้าก่อนที่แคมเปญจะออกอากาศจริงอีกด้วย ตัวอย่างเช่น ในสหรัฐอเมริกา เครือข่ายโทรทัศน์จะขายโฆษณาส่วนใหญ่สำหรับซีซันนั้นแบบ “ล่วงหน้า” ซึ่งเป็นงานที่จัดขึ้นเพียงปีละครั้ง (ระหว่างเดือนมีนาคมถึงพฤษภาคม) ซึ่งหมายความว่าอัตราค่าโฆษณาที่คุณเห็นทางทีวีในปัจจุบันอาจได้มีการเจรจากันไว้ตั้งแต่หนึ่งปีก่อนแล้ว

นักวิจัยใช้โมเดลการคาดการณ์เพื่อทำนายว่ารายการหนึ่งๆ จะมีเรตติ้งเท่าไรในอีก 3, 6 หรือ 12 เดือนข้างหน้า โมเดลเหล่านี้หลายตัวถูกใช้มาหลายปีแล้วโดยแทบไม่ต้องปรับเปลี่ยนเลย โมเดลเหล่านี้ประสบความสำเร็จในการทำนายเรตติ้งและช่วยสนับสนุนการแลกเปลี่ยนเงินโฆษณาหลายพันล้านดอลลาร์ในแต่ละปีได้เป็นอย่างดี แต่การเปลี่ยนแปลงอย่างรวดเร็วในระบบนิเวศของทีวีทำให้การพัฒนาโมเดลที่เชื่อถือได้นั้นยากขึ้นเรื่อยๆ

ลองพิจารณารายการนวัตกรรมเทคโนโลยีล่าสุดในอุตสาหกรรมสื่อ: ผู้ชมใช้แล็ปท็อป แท็บเล็ต และสมาร์ทโฟนในการรับชมเนื้อหามากขึ้น บริการสตรีมมิ่งอย่าง Netflix และ Amazon Prime ได้รับการยอมรับอย่างแพร่หลาย อุปกรณ์ใหม่ที่เชื่อมต่อกับทีวีกำลังเปลี่ยนโฉมประสบการณ์การรับชมหน้าจอขนาดใหญ่ ผู้คนต่างเปลี่ยนเวลา สตรีมและดูแบบรวดเดียว พวกเขาสามารถควบคุมสื่อที่รับชมได้มากกว่าที่เคยเป็นมา พฤติกรรมของพวกเขาไม่เพียงแต่ซับซ้อนมากขึ้นเท่านั้น แต่ยังคาดเดาได้ยากมากขึ้นด้วย

ที่ Nielsen เราสามารถเข้าถึงแหล่งข้อมูลต่างๆ มากมายที่วัดว่าผู้คนบริโภคสื่อมากเพียงใด ก่อนที่จะเพิ่มข้อมูลทีวีดิจิทัลเข้าไป (ทั้งเป็นอินพุตและเอาต์พุตของแบบจำลองการคาดการณ์ของเรา) เราต้องการตรวจสอบว่าเป็นไปได้หรือไม่ที่จะปรับปรุงวิธีการคาดการณ์เรตติ้งของทีวีแบบดั้งเดิมก่อน โดยใช้ข้อมูลทีวีแบบดั้งเดิมเป็นแหล่งข้อมูลเดียวของเรา ด้วย Nielsen National People Meter เราจึงได้ข้อมูลคุณภาพสูงที่ย้อนหลังไปได้หลายปี โดยมีระเบียบวิธีที่สอดคล้องกันและกลุ่มผู้ชมที่เป็นตัวแทนระดับประเทศที่แข็งแกร่ง

เราใช้ข้อมูลอันมีคุณค่านี้ในระดับที่ละเอียดมากเพื่อสร้างโมเดลการทำนายแบบใหม่: ตัวแปรต่างๆ เช่น เรตติ้ง Live+7 ในอดีต (กล่าวคือ เรตติ้งที่รวมถึงผู้ชมสด รวมถึงผู้ชมสูงสุดเจ็ดวันหลังจากการออกอากาศครั้งแรก) เรตติ้ง C3 (เรตติ้งเชิงพาณิชย์ที่รวมการเล่นซ้ำสูงสุดสามวันหลังจากนั้น) HUT (เปอร์เซ็นต์ของครัวเรือนที่รับชมโทรทัศน์ในทุกช่วงเวลา) การเข้าถึง เรตติ้งครัวเรือน เรตติ้งตามกลุ่มประชากร วันในสัปดาห์ ชั่วโมงของวัน และตัวตนของเครือข่าย เป็นข้อมูลสำคัญบางส่วนที่เราใช้เป็นตัวแปรอินพุต และเราใช้ประโยชน์จากการเรียนรู้ของเครื่องจักรขั้นสูงและอัลกอริทึมทางสถิติ (เช่น การถดถอยเชิงสันเขา แรนดอมฟอเรสต์ และการเสริมการไล่ระดับ) เพื่อระบุความสัมพันธ์ของข้อมูลที่เกี่ยวข้อง

เราทำงานร่วมกับลูกค้าเพื่อทำการศึกษาแนวคิดเชิงพิสูจน์จำนวนหนึ่งเพื่อทดสอบและตรวจสอบความถูกต้องของโมเดลที่เราสร้างขึ้น เราออกแบบโมเดลของเราเพื่อทำนายคะแนนในอนาคตในระดับรายละเอียด (ช่วงชั่วโมงสำหรับกลุ่มประชากรขนาดเล็ก เช่น ผู้ชายอายุ 2-5 ขวบ หรือผู้หญิงอายุ 65 ปีขึ้นไป) แต่เรายังรวมตัวเลขเหล่านั้นเข้ากับระดับเครือข่ายด้วย เพื่อทำความเข้าใจว่าโมเดลของเรามีประสิทธิภาพเทียบกับความเป็นจริงอย่างไร เราใช้ช่วงเวลาสองไตรมาสในการเปรียบเทียบการคาดการณ์ของเรา รวมถึงการคาดการณ์ภายในของลูกค้ากับข้อมูลคะแนนที่แท้จริง ตัวอย่างเช่น เราคาดการณ์คะแนนเฉลี่ย Live+7 ได้อย่างแม่นยำที่ 1.94 สำหรับบุคคลอายุ 30-34 ปีในเครือข่าย A ระหว่าง 21.00 น. ถึง 22.00 น. ในวันอังคารในช่วงไตรมาสที่สองของปี 2015 โดยอิงจากข้อมูลในอดีตจนถึงไตรมาสแรกของปี 2014 เท่านั้น การพยากรณ์มีความแม่นยำมากในระดับเครือข่าย ซึ่งเรามี R-squared (เปอร์เซ็นต์ของความแปรปรวนที่อธิบายได้) 99% แต่การพยากรณ์ทำได้ยากกว่าในระดับช่วงวันของบล็อกชั่วโมงที่ละเอียดกว่า หรือสำหรับกลุ่มประชากรที่เล็กกว่าบางกลุ่ม แม้จะอยู่ที่ระดับบล็อกชั่วโมง แต่ R-squared ของแบบจำลองของเรายังคงสูงกว่า 95% และมีประสิทธิภาพดีกว่าแบบจำลองที่ลูกค้าของเราพึ่งพามาจนถึงจุดนั้นอย่างมาก จากการคาดการณ์ในเวลากลางวันมากกว่า 2,000 ครั้ง การพยากรณ์ของเรามีความแม่นยำมากกว่า R-squared 41% และข้อผิดพลาดเปอร์เซ็นต์สัมบูรณ์ถ่วงน้ำหนัก (WAPE) 16% ซึ่งเป็นสองมาตรการสำคัญในการพยากรณ์ความแม่นยำ

เราจะแบ่งปันรายละเอียดเพิ่มเติมเกี่ยวกับโมเดลการพิสูจน์แนวคิดและการทดสอบที่เราทำในเอกสารฉบับต่อไป สิ่งสำคัญที่ได้จากโครงการนี้คือ เราสามารถแปลงข้อมูลพฤติกรรมขนาดใหญ่และซับซ้อนเป็นคุณลักษณะการสร้างแบบจำลองเชิงทำนายได้ และดำเนินการในลักษณะที่มีประสิทธิภาพ (และอัตโนมัติ) มาก แต่จุดทศนิยมทุกจุดของจุดเรตติ้งมีผลกระทบทางการเงินมหาศาล และเราจำเป็นต้องพยายามต่อไปโดยการเพิ่มตัวแปรอินพุตใหม่ๆ (เช่น การใช้จ่ายโฆษณาหรือข้อมูลเฉพาะโปรแกรม) สร้างวิธีการปรับตัวอย่างรวดเร็วกับการเปลี่ยนแปลงในแพ็คเกจโปรแกรมและรายการช่อง การทดสอบรูปแบบใหม่ของอัลกอริทึมการถดถอยและการจำแนกประเภท หรือแม้แต่การรวมโมเดลที่มีแนวโน้มดีหลายแบบเข้าด้วยกัน

แม้ว่าโครงการนี้จะเน้นที่ทีวีแบบดั้งเดิม แต่ก็น่าสนใจที่จะสังเกตว่าผลกระทบของข้อมูลดิจิทัลสะท้อนให้เห็นในการเปลี่ยนแปลงของเรตติ้งทีวีในข้อมูลในอดีต และในการคาดการณ์ของเราด้วยเช่นกัน แต่สิ่งนี้เป็นการวัดผลสะสมทางอ้อม และไม่สามารถทดแทนโมเดลที่เน้นเฉพาะการรับชมแบบ OTT หรือการรับชมผ่านแอปสมาร์ทโฟนได้ นอกเหนือจากขั้นตอนต่อไปที่อธิบายไว้ข้างต้นแล้ว การใช้ข้อมูลดิจิทัลจะเป็นองค์ประกอบสำคัญในการปรับปรุงการคาดการณ์ของเราในอนาคต

ในท้ายที่สุด เราจำเป็นต้องตระหนักว่าลูกค้าแต่ละรายมีความรู้เกี่ยวกับโปรแกรมของตนเป็นอย่างดี รวมถึงมีลางสังหรณ์ที่แข็งแกร่งว่าโปรแกรมเหล่านั้นจะได้รับการตอบรับอย่างไรในอนาคต ไม่ควรละเลย "องค์ประกอบของมนุษย์" เมื่อเราจัดทำแบบจำลองเชิงทำนาย และอาจมีประโยชน์อย่างยิ่งเมื่อต้องตอบสนองต่อการเปลี่ยนแปลงที่สำคัญและไม่คาดคิดในตลาด ระบบที่ผสานรวมข้อมูลอันหลากหลาย อัลกอริทึมการเรียนรู้ของเครื่องจักรอันทรงพลัง และความเชี่ยวชาญเฉพาะด้านสามารถให้ผลลัพธ์ที่ดีกว่าที่ทั้งสองฝ่ายสามารถทำได้ด้วยตัวเอง

แท็กที่เกี่ยวข้อง:

ดำเนินการเรียกดูข้อมูลเชิงลึกที่คล้ายกันต่อไป

ผลิตภัณฑ์ของเราสามารถช่วยคุณและธุรกิจของคุณได้