Vivemos em um mundo no qual os dados estão crescendo exponencialmente, e cada vez mais esforços estão sendo feitos para fazer melhor uso deles. Atualmente, os profissionais de marketing têm dados mais do que suficientes à sua disposição, mas estão procurando maneiras melhores de usar e conectar seus conjuntos de dados para obter insights mais profundos e valiosos.
O desafio está na forma como encaramos a aplicação da ciência de dados e na maneira como nós, cientistas de dados, fomos treinados. Ao longo dos anos, trabalhando em projetos de ciência de dados e análise, pude ver uma maneira mais fácil de atingir objetivos maiores e mais audaciosos.
É um processo de quatro etapas:
- Comece com um resultado ambicioso
- Divida o resultado em conjuntos de ações menores
- Explore os dados e execute a análise (iterativa)
- Associe as descobertas ao resultado definido
Esse processo funciona melhor do que o processo tradicional de solução de problemas de ciência de dados porque reduz a ambiguidade e estimula a busca de resultados por todos os envolvidos. O processo tradicional de ciência de dados geralmente começa com a identificação de uma declaração de problema e, em seguida, avança para a coleta de dados, a modelagem de dados e a avaliação. No centro do processo tradicional de ciência de dados está a complexidade. A complexidade geralmente nos força a pensar de forma mais racional e analítica e não nos faz usar nossa criatividade. A ambição, por outro lado, nos incentiva a começar com o pensamento criativo e, em seguida, a avançar para o lado analítico do cérebro.
Agora vamos dividir nosso processo em etapas individuais.
Comece com um resultado ambicioso
Digamos que você queira obter 5% de participação adicional no próximo ano. Primeiro, defina seu resultado ambicioso. Nesse caso, 5% a mais de participação. A psicologia comportamental diz que é importante reformular a meta de forma positiva, pois isso leva sua mente a pensar de forma mais criativa para atingir as metas.
Neste exemplo, digamos que você queira aumentar a participação expandindo sua rede de distribuição na Indonésia. A Indonésia é um país muito fragmentado geograficamente, com 17.000 ilhas, e o transporte é um desafio. Para conseguir isso, o objetivo é atingir de 50% a 80% do mercado com o menor custo possível e tudo isso no período de um ano.
Divida seu resultado em conjuntos de ações menores
Isso é fundamental porque você deseja dividir seu grande e ambicioso resultado em conjuntos menores e gerenciáveis. Também ajuda a colocar seus dados em conjuntos "mutuamente exclusivos e coletivamente exaustivos". Isso ajuda a dividi-los em vários subobjetivos e a acelerar o processo. Em nosso exemplo, dividimos o resultado em três conjuntos de ações:
- Regiões geográficas densas que exigem a instalação de distribuidores
- Regiões geográficas dispersas que exigem configurações de subdistribuidores
- Grupos populacionais em crescimento
Explorar conjuntos de dados e executar a análise
Essa é uma grande parte do processo. Comece explorando as fontes de dados e listando o que está disponível e o que não está (mas é imprescindível). Neste exemplo, podemos usar o censo de varejo da Nielsen e os dados do painel de varejo com diferentes recursos, como tamanho da loja, vendas da loja, coordenadas de localização da loja etc. Em seguida, podemos integrar esses dois conjuntos de dados para chegar a uma série de recursos significativos.
Entretanto, também reconhecemos onde nossos conjuntos de dados são insuficientes. Nesse caso, podemos descobrir que há uma área considerável fora do nosso escopo de varejo. Como resultado, talvez não tenhamos certos tipos de informações, como população, número de bancos, que pode indicar prosperidade, e outros dados. Portanto, precisamos identificar outras fontes, como censos populacionais, para obter essas características.
Esses conjuntos de dados são então fundidos e executados por meio de um modelo de regressão múltipla, que identifica a oportunidade para cada área/localidade.
É provável que sejam necessárias algumas iterações para garantir a precisão da previsão. Por fim, esses dados podem ser mesclados com dados de distribuição do cliente ou de terceiros.
Associe as descobertas ao resultado
A etapa final é unir todos os resultados dos conjuntos de ações.
Nesse exemplo, podemos usar esses dados para desenhar agrupamentos de áreas/ quarteirões que oferecem a maior oportunidade e que podem ser realisticamente suportados pela rede de distribuição existente com apenas um pequeno aumento em seu raio e com a criação de poucos subdistribuidores em agrupamentos em crescimento.
Neste exemplo, conseguimos combinar vários conjuntos de dados para oferecer uma solução simples que delineia uma solução clara para uma meta grande e ambiciosa. Isso mostra que nem sempre vale a pena começar com uma declaração de problema, mas sim com uma meta ambiciosa e positiva.
Portanto, da próxima vez que começar um novo projeto, dê uma chance a esse processo e comece com uma meta ambiciosa e pensamento criativo.