오늘 TV를 켜 보셨나요? 라디오는 어떤가요? 스마트폰에서 앱을 사용해 보셨을 것입니다. 마트에서 저녁 식사 재료를 구입하거나 온라인으로 새 샴푸 한 병을 구입했을 수도 있습니다.
이러한 모든 활동은 단순하고 일상적인 행동입니다. 하지만 오늘날과 같이 방대하고 서로 연결되어 있으며 디지털화되어 있는 세상에서는 이러한 활동도 중요한 데이터 포인트가 됩니다.
중요한 것은 브랜드와 마케터가 소비자의 니즈를 이해하고, 이러한 니즈를 충족하기 위해 더 나은 의사 결정을 내리고, 궁극적으로 비즈니스의 성장을 촉진할 수 있다는 점입니다. 하지만 먼저 브랜드와 마케터는 모든 데이터를 이해해야 합니다.
오늘날 디지털 시대에 우리 모두가 생성하는 데이터의 규모와 범위는 엄청날 수 있으며, 닐슨은 이러한 데이터의 상당 부분을 측정합니다. 이를 생각해 보세요: 닐슨은 매월 17억 건의 TV 시청 기록, 매월 67억 건의 매장 거래, 매년 1조 6천억 건의 온라인 노출을 수집합니다! 우리의 일상적인 행동으로 인해 생성되는 방대하고 때로는 지저분한 데이터 더미를 유용하고 실용적이며 의미 있는 정보로 정리하는 동시에 데이터의 책임 있는 관리자가 되어 사람들의 개인정보를 보호하려면 특별한 지식과 기술이 필요합니다.
다행히도 브랜드와 마케터에게 새로운 데이터 소스를 제공하는 기술과 플랫폼이 급성장하면서 해당 데이터를 측정하고 인사이트를 도출할 수 있는 새로운 도구와 수단도 등장하고 있습니다. 소비자가 생성하는 빅데이터를 분석하고 이해하는 데 도움이 되는 새로운 데이터 소스와 분석 도구를 찾는 것이 데이터 과학 팀의 역할입니다. 데이터 과학자들은 과학적 방법, 프로세스, 알고리즘 및 시스템을 사용하여 이러한 눈덩이처럼 불어나는 데이터 포인트에서 가치 있는 인사이트를 발견하고 있습니다.
닐슨의 약 1,100명의 데이터 과학자들은 고객을 위해 '점들을 연결'하고 소비자의 니즈에 대한 스토리를 전달하기 위해 건전하고 반복 가능한 방법을 찾는 임무를 맡고 있습니다. 이 비유에서 '점'은 고객이 소비자를 이해하기 위해 노력할 때 사용할 수 있는 무한한 데이터 포인트를 의미하지만, 데이터 과학자들이 만들어내는 연결은 고객의 의사 결정에 가장 중요한 정보이자 성장의 원동력입니다.
저는 닐슨의 데이터 과학자 팀의 일원으로서 데이터를 통합하고 고객을 위한 주요 연결고리를 만들기 위한 맞춤형 솔루션을 개발하는 일을 하고 있습니다. 이러한 솔루션에는 데이터 융합, 맞춤형 잠재고객 세분화, ROI 분석 및 데이터 소스를 통합하여 소비자에 대한 특정 비즈니스 질문에 답하기 위한 완전히 새로운 방법론이 포함됩니다.
새로운 기술과 빅데이터가 우리가 구매하는 미디어와 제품의 소비를 측정하는 방식을 혁신적으로 변화시키고 있다는 것은 의심할 여지가 없습니다. 하지만 이러한 기술에도 한계가 있다는 사실을 기억하는 것도 중요합니다.
기술은 일반적으로 측정을 염두에 두고 개발되지 않습니다. 따라서 빅 데이터는 여러 가지 면에서 편향될 수 있습니다. 예를 들어 TV에서 채널을 변경할 때 사용하는 리모컨을 생각해 보세요. 버튼을 누르면 상자에 신호가 전송되고 그 신호가 데이터를 생성합니다. 하지만 이 데이터는 사용자에 대해 알 수 있는 정보가 제한적입니다. 예를 들어, 사용자가 버튼을 눌렀는지 아니면 다른 가족 구성원이 눌렀는지는 알 수 없습니다. 편향된 데이터는 소비자에 대한 잘못된 인사이트와 마케터의 잘못된 의사 결정으로 이어질 수 있습니다.
다른 예가 있습니다: TV 연결 장치와 구독형 주문형 비디오 서비스를 통해 소비자는 원하는 시간에 원하는 콘텐츠를 선택할 수 있습니다. 하지만 미국인의 약 60%만이 이러한 디바이스를 소유하고 있습니다. 따라서 이러한 디바이스의 데이터는 미국 전체 인구를 대표하지 못합니다. 또한 이러한 데이터를 선형 TV 지표와 비교할 수 있도록 만들어야 TV 환경에 대한 전체적인 관점을 제공할 수 있습니다.
닐슨에서는 빅데이터와 함께 패널을 사용하여 데이터 포인트와 실제 사람을 매칭합니다. 잘 구성된 패널은 빅 데이터에 내재된 많은 편견을 제거할 수 있습니다. 예를 들어, 우리는 미국 TV 패널을 사용하여 연령, 인종, 소득 수준별로 미국 인구를 통계적으로 나타냅니다. 이러한 패널에서 얻은 인사이트를 케이블 제공업체와의 협력을 통해 케이블 박스에서 수집한 빅 데이터와 결합하면 누가 리모컨 뒤에 숨어 있는지 파악할 수 있습니다. 따라서 패널과 빅 데이터를 결합한 하이브리드 측정 방식은 빅 데이터의 세분성과 세부성을 제공하는 동시에 패널의 편향성 감소와 대표성을 제공할 수 있습니다.
인공지능(AI)의 활용도가 기하급수적으로 증가함에 따라 데이터 입력이 깨끗하고 신뢰할 수 있으며 대표성을 갖도록 하는 것이 그 어느 때보다 중요해졌습니다. 이 기준을 충족하지 못하면 (AI 덕분에) 잘못된 결과를 더 많이 생산한다는 의미일 뿐입니다. 입력된 데이터는 쓰레기라는 사실을 기억하는 것이 중요합니다. 소위 '충분히 좋은' 데이터는 AI 세계에서는 충분하지 않습니다.
데이터 과학자 역시 측정의 편향을 줄이는 데 중요한 역할을 합니다. 닐슨의 데이터 과학 팀에는 실제로 매우 재능 있는 통계학자들이 포함되어 있지만, 많은 사람들이 닐슨의 데이터 과학 팀이 실제로 얼마나 다양한지 알고 나면 놀랄 것입니다. 닐슨의 데이터 과학 팀에는 수학, 행동과학, 화학공학, 물리학, 교육학, 경제학, 컴퓨터 공학 등 다양한 배경을 가진 직원들이 포함되어 있습니다. 이러한 다양한 관점은 측정 시 다양한 관점을 고려하는 데 도움이 됩니다.
궁극적으로 오늘날의 빅데이터 세계에서는 재무, 고객 서비스, 인사, 미디어 분석 등 점점 더 많은 비즈니스 분야가 각자의 업무에 데이터 과학을 통합하는 방향으로 발전하고 있습니다. 다양한 배경을 가진 더 많은 사람들이 통계적 방법, 프로그래밍 및 분석 기술에 대한 핵심 지식을 갖추게 되면 오늘날 비즈니스의 다양한 영역에서 더 나은 의사결정을 내릴 수 있는 길이 열리게 됩니다.
이 분야에 새로 진입한 사람들이 일상적인 데이터 포인트에서 양질의 인사이트를 얻는 데 필요한 편견과 고려 사항을 이해한다면 이는 데이터 과학의 미래를 위한 좋은 징조라고 생각합니다.