우리는 데이터가 기하급수적으로 증가하는 세상에 살고 있으며, 데이터를 더 잘 활용하기 위해 점점 더 많은 노력을 기울이고 있습니다. 오늘날 마케터들은 사용할 수 있는 데이터가 충분하지만, 더 깊이 있고 가치 있는 인사이트를 얻기 위해 데이터 세트를 사용하고 연결할 수 있는 더 나은 방법을 모색하고 있습니다.
문제는 데이터 과학의 적용을 바라보는 방식과 데이터 과학자로서 우리가 훈련받은 방식에 있습니다. 수년간 데이터 과학 및 분석 프로젝트에 참여하면서 저는 더 크고 대담한 목표를 달성할 수 있는 더 쉬운 방법을 발견할 수 있었습니다.
이 과정은 4단계로 이루어집니다:
- 야심찬 결과물부터 시작하세요
- 결과를 더 작은 작업 집합으로 나누기
- 데이터 탐색 및 분석 실행(반복)
- 결과를 설정된 결과와 연결하기
이 프로세스는 모호성을 줄이고 관련된 모든 사람의 성과에 대한 추진력을 촉진하기 때문에 기존의 데이터 과학 문제 해결 프로세스보다 더 효과적입니다. 전통적인 데이터 과학 프로세스는 일반적으로 문제 진술 식별에서 시작하여 데이터 수집, 데이터 모델링 및 평가로 나아갑니다. 전통적인 데이터 과학 프로세스의 핵심은 복잡성입니다. 복잡성은 일반적으로 더 합리적이고 분석적으로 생각하게 만들며 창의력을 발휘하지 못하게 합니다. 반면에 야망은 창의적인 사고로 시작한 다음 분석적인 측면으로 나아가도록 장려합니다.
이제 프로세스를 개별 단계로 나눠 보겠습니다.
야심찬 결과물부터 시작하세요
내년에 5%의 추가 점유율을 달성하고 싶다고 가정해 보겠습니다. 먼저 야심찬 결과를 정의합니다. 이 경우, 점유율 5% 추가. 행동 심리학에서는 목표를 긍정적으로 재구성하는 것이 중요하다고 말합니다. 목표를 달성하기 위해 더 창의적으로 생각하도록 마음을 유도하기 때문입니다.
이 예에서는 인도네시아에서 유통망을 확장하여 점유율을 높이고자 한다고 가정해 보겠습니다. 인도네시아는 17,000개의 섬으로 이루어진 지리적으로 매우 분열된 국가이며 운송이 어려운 상황입니다. 이를 달성하기 위해 가능한 한 가장 낮은 비용으로 시장의 50%에서 80%까지 도달하는 것이 목표이며, 이 모든 것을 1년 안에 달성하는 것이 목표입니다.
결과를 더 작은 작업 집합으로 나누기
이는 큰 야심 찬 결과를 관리하기 쉬운 작은 집합으로 나누고 싶을 때 매우 중요합니다. 또한 데이터를 '상호 배타적인 집합'에 넣는 것도 도움이 됩니다. 이렇게 하면 데이터를 여러 하위 목표로 나누고 프로세스를 빠르게 추적하는 데 도움이 됩니다. 이 예에서는 결과를 세 가지 작업 집합으로 나누었습니다:
- 배포자 설정이 필요한 밀집된 지역
- 하위 배포자 설정이 필요한 흩어져 있는 지역
- 증가하는 인구 클러스터
데이터 집합 탐색 및 분석 실행
이것은 프로세스의 큰 부분입니다. 먼저 데이터 소스를 탐색하고 사용할 수 있는 데이터와 사용할 수 없지만 꼭 필요한 데이터를 나열하는 것으로 시작하세요. 이 예에서는 매장 규모, 매장 매출, 매장 위치 좌표 등과 같은 다양한 특징을 가진 Nielsen 소매 센서스 데이터와 소매 패널 데이터를 사용할 수 있습니다. 그런 다음 이 두 데이터 세트를 통합하여 여러 가지 의미 있는 기능을 얻을 수 있습니다.
그러나 데이터 세트가 부족한 부분도 파악하고 있습니다. 이 경우, 소매업 범위를 벗어난 상당한 지역이 존재할 수 있습니다. 그 결과 인구, 번영을 나타낼 수 있는 은행 수 및 기타 데이터와 같은 특정 유형의 정보가 없을 수 있습니다. 따라서 이러한 기능을 얻으려면 인구 센서스와 같은 다른 소스를 확인해야 합니다.
그런 다음 이러한 데이터 세트를 융합하고 다중 회귀 모델을 통해 실행하여 각 지역/지역에 대한 기회를 식별합니다.
예측의 정확성을 보장하기 위해 몇 번의 반복이 필요할 수 있습니다. 마지막으로 이 데이터를 클라이언트 또는 퍼스트 파티 배포 데이터와 병합할 수 있습니다.
결과를 결과와 연결
마지막 단계는 액션 세트의 모든 결과를 하나로 묶는 것입니다.
이 예에서는 이 데이터를 사용하여 가장 많은 기회를 제공하고 기존 유통망에서 반경을 약간 늘리고 성장하는 클러스터에 몇 개의 하위 유통업체를 설정하는 것만으로 현실적으로 지원할 수 있는 지역/블록 클러스터를 도출할 수 있습니다.
이 예에서는 여러 데이터 집합을 결합하여 크고 야심찬 목표에 대한 명확한 해결책을 제시하는 간단한 솔루션을 제공할 수 있습니다. 이는 항상 문제 진술로 시작하는 것이 아니라 긍정적이고 야심찬 목표로 시작하는 것이 더 효과적이라는 것을 보여줍니다.
따라서 다음에 새로운 프로젝트를 시작할 때는 이 프로세스에 기회를 주고 야심찬 목표와 창의적인 사고로 시작하세요.