콘텐츠로 건너뛰기
청중> 통찰력

빅 데이터를 이해하는 과학

5 분 읽기 | Clem Thompson, 데이터 과학 부사장, Nielsen | 할 수있다 2019

오늘 TV를 켜셨습니까? 라디오는 어떻습니까? 당신은 아마 당신의 스마트 폰에서 응용 프로그램을 사용했을 것입니다. 어쩌면 당신은 상점에서 저녁 식사를 위해 재료를 구입했거나 온라인으로 새로운 샴푸 병을 구입했을 것입니다.

이러한 모든 활동은 단순하고 일상적인 행동입니다. 그러나 오늘날의 광대하고 상호 연결되며 자주 디지털 세계에서 그들은 또한 귀중한 데이터 포인트입니다.

중요한 것은 브랜드와 마케팅 담당자가 소비자의 요구를 이해하고, 이러한 요구를 충족시키기 위해 더 나은 결정을 내리고, 궁극적으로 비즈니스 성장을 주도하도록 도울 수 있다는 것입니다. 그러나 먼저 브랜드와 마케팅 담당자는 모든 데이터를 이해해야합니다.

오늘날의 디지털 시대에 우리 모두가 생성하는 데이터의 크기와 범위는 엄청날 수 있으며 닐슨은 많은 것을 측정합니다. 이것을 고려하십시오 : 닐슨은 매월 1.7 억 개의 TV 시청 기록, 매월 6.7 억 건의 매장 거래 및 매년 1.6 조 건의 온라인 노출을 수집합니다! 우리의 일상 행동에 의해 생성 된 거대하고 때로는 지저분한 데이터 더미를 가져 와서 유용하고 실용적이며 의미있는 정보로 구성하는 동시에 책임있는 데이터 관리자가되고 사람들의 개인 정보를 보장하려면 특정 지식과 기술이 필요합니다.

다행스럽게도 브랜드와 마케터에게 새로운 데이터 소스를 제공하는 급성장하는 기술과 플랫폼은 해당 데이터에서 통찰력을 측정하고 도출하는 새로운 도구와 수단을 가능하게합니다. 소비자가 만드는 빅 데이터를 구문 분석(따라서 이해할 수 있도록)하는 데 도움이 될 수 있는 새로운 데이터 원본과 분석 도구를 추구하는 것은 데이터 과학 팀의 역할입니다. 데이터 과학자는 과학적 방법, 프로세스, 알고리즘 및 시스템을 사용하여 이러한 눈덩이 데이터 포인트 집합 내에서 귀중한 통찰력을 발견하고 있습니다.

닐슨에서는 약 1,100명의 데이터 과학자가 고객을 위해 "점 연결"이라는 건전하고 반복 가능한 방법을 찾고 소비자의 요구에 대한 이야기를 전하는 임무를 맡고 있습니다. 이 비유의 "점"은 고객이 소비자를 이해하려고 노력할 때 사용할 수있는 무한한 데이터 포인트를 나타내는 반면, 데이터 과학자가 생성 할 수있는 연결은 고객의 의사 결정에 대한 1 위 입력이며 성장을위한 연료입니다.

Nielsen의 데이터 과학자 팀의 일원으로서 저는 데이터를 통합하고 고객을 위한 핵심 연결을 만들기 위한 맞춤형 솔루션을 개발하기 위해 노력하고 있습니다. 이러한 솔루션에는 데이터 융합, 사용정 잠재 고객 세분화, ROI 분석 및 완전히 새로운 방법론이 포함되어 데이터 소스를 통합하여 소비자에 대한 특정 비즈니스 질문에 답할 수 있습니다.

새로운 기술과 빅 데이터가 우리가 구매하는 미디어 및 제품의 소비를 측정하는 방법에 혁명을 일으키고 있다는 것은 의심의 여지가 없습니다. 그러나 그들에게도 한계가 있다는 것을 기억하는 것도 중요합니다.

기술은 일반적으로 측정을 염두에두고 만들어지지 않습니다. 결과적으로 빅 데이터는 여러 가지 방법으로 편향 될 수 있습니다. 예를 들어 TV에서 채널을 변경하는 데 사용하는 리모컨에 대해 생각해보십시오. 버튼을 누르면 상자로 신호가 전송되고 해당 신호가 데이터를 생성합니다. 그러나 그 데이터는 당신에 대해 말할 수있는 것에 제한되어 있습니다. 예를 들어, 버튼을 눌렀는지 또는 다른 가족 구성원이 누를 지 알 수 없습니다. 편향된 데이터는 소비자에 대한 잘못된 통찰력과 마케터의 잘못된 결정으로 이어질 수 있습니다.

또 다른 예가 있습니다 : TV 연결 장치 및 구독 주문형 비디오 서비스를 통해 소비자는 원할 때 원하는 것을 선택할 수 있습니다. 그러나 미국인의 약 60 % 만이 이러한 장치를 소유하고 있습니다. 결과적으로 이러한 장치의 데이터는 전체 미국 인구를 대표하지 않습니다. 또한 이러한 데이터는 TV 환경에 대한 전체적인 보기를 제공하기 위해 선형 TV 메트릭과 비교할 수 있어야 합니다.

Nielsen에서는 빅 데이터와 함께 패널을 사용하여 데이터 포인트를 실제 사람들과 일치시킵니다. 잘 구성된 패널은 빅 데이터에 내재 된 많은 편견을 제거 할 수 있습니다. 예를 들어, 우리는 미국 TV 패널을 사용하여 나이, 민족 및 소득 수준별로 국가 인구를 통계적으로 나타냅니다. 이러한 패널의 통찰력과 케이블 제공업체 회사와의 협업 덕분에 Nielsen이 케이블 박스에서 받은 빅 데이터를 결합함으로써 리모컨 뒤에 누가 있는지 확인할 수 있습니다. 따라서 패널과 빅 데이터를 포함하는 하이브리드 측정 접근법은 빅 데이터의 세분성과 세부 사항을 제공하고 패널의 바이어스 감소 및 대표성을 제공 할 수 있습니다.

인공 지능 (AI)을 작동 할 때 제공되는 마력이 기하 급수적으로 증가함에 따라 데이터 입력이 깨끗하고 신뢰할 수 있으며 대표적인지 확인하는 것이 더 중요 한 적이 없었습니다. 이 기준을 충족시키지 못하면 단순히 결과가 좋지 않은 더 많은 양을 생산하고 있음을 의미합니다 (AI 덕분에). 쓰레기가 들어오고 쓰레기가 배출된다는 것을 기억하는 것이 중요합니다. 소위 "충분히 좋은"데이터는 AI 세계에서 충분하지 않습니다.

데이터 과학자 자신도 측정의 편향을 줄이는 데 중요한 역할을 합니다. 우리의 데이터 과학 팀에는 실제로 매우 재능있는 통계 학자가 포함되어 있지만, 많은 사람들은 우리 팀이 실제로 얼마나 다양한지를 알고 놀랄 것입니다. 닐슨의 데이터 과학 팀에는 수학, 행동 과학, 화학 공학, 물리학, 교육, 경제 및 컴퓨터 공학과 같은 다양한 배경을 가진 동료들이 포함됩니다. 이러한 다양한 관점은 우리가 측정에서 다른 관점을 고려하도록 보장합니다.

궁극적으로, 오늘날의 빅 데이터 세계에서는 금융, 고객 서비스, 인적 자원, 미디어 분석 등 점점 더 많은 비즈니스 분야가 데이터 과학을 각자의 관행에 통합하기 위해 진화하고 있습니다. 통계 방법, 프로그래밍 및 분석 기술에 대한 핵심 지식으로 다양한 배경을 가진 더 많은 사람들에게 권한을 부여하면 오늘날 다양한 비즈니스 영역에서 더 나은 의사 결정을위한 문이 열립니다.

저는 이것이 데이터 과학의 미래에 좋은 징조라고 믿으며, 현장에 새로 진입한 사람들이 우리의 일상적인 데이터 포인트 내에서 양질의 통찰력을 얻는 데 필요한 편견과 고려 사항을 이해하게 해줍니다.