
Nous vivons dans un monde où les données augmentent de façon exponentielle et où l'on s'efforce de mieux les utiliser. Les spécialistes du marketing disposent aujourd'hui d'une quantité plus que suffisante de données, mais ils cherchent de meilleurs moyens d'utiliser et de connecter leurs ensembles de données afin d'obtenir des informations plus approfondies et plus précieuses.
Le défi réside dans la façon dont nous envisageons l'application de la science des données et dans la façon dont nous avons été formés en tant que scientifiques des données. En travaillant au fil des ans sur des projets de science des données et d'analyse, j'ai pu constater qu'il existait un moyen plus facile d'atteindre des objectifs plus importants et plus audacieux.
Il s'agit d'un processus en quatre étapes :
- Commencer par un résultat ambitieux
- Décomposer le résultat en petites séries d'actions
- Explorer les données et effectuer l'analyse (itératif)
- Lier les résultats à l'objectif fixé
Ce processus est plus efficace que le processus traditionnel de résolution de problèmes en science des données, car il réduit l'ambiguïté et stimule la volonté d'obtenir des résultats chez toutes les personnes concernées. Le processus traditionnel de la science des données commence généralement par l'identification d'un énoncé de problème, puis passe à la collecte de données, à la modélisation des données et à l'évaluation. La complexité est au cœur du processus traditionnel de la science des données. La complexité nous oblige généralement à penser de manière plus rationnelle et analytique et ne nous incite pas à faire appel à notre créativité. L'ambition, en revanche, nous encourage à commencer par la pensée créative, puis à nous tourner vers le côté analytique de notre cerveau.
Décomposons maintenant notre processus en différentes étapes.
Commencer par un résultat ambitieux
Supposons que vous souhaitiez augmenter votre part de marché de 5 % au cours de l'année à venir. Commencez par définir votre objectif ambitieux. Dans le cas présent, il s'agit de 5 % de parts supplémentaires. Selon la psychologie comportementale, il est important de recadrer l'objectif de manière positive, car cela incite l'esprit à penser de manière plus créative afin d'atteindre les objectifs.
Dans cet exemple, disons que vous souhaitez augmenter votre part de marché en développant votre réseau de distribution en Indonésie. L'Indonésie est un pays très fragmenté géographiquement, avec 17 000 îles, et le transport est un défi. Pour y parvenir, l'objectif est d'atteindre de 50 à 80 % du marché au coût le plus bas possible, et ce en l'espace d'un an.
Décomposez votre résultat en petites séries d'actions
Cette étape est cruciale car vous souhaitez diviser votre grand résultat ambitieux en ensembles plus petits et plus faciles à gérer. Il est également utile de classer vos données dans des ensembles "mutuellement exclusifs et collectivement exhaustifs". Cela permet de diviser le résultat en plusieurs sous-objectifs et d'accélérer le processus. Dans notre exemple, nous avons divisé le résultat en trois séries d'actions :
- Géographies denses nécessitant la mise en place d'un distributeur
- Des zones géographiques dispersées nécessitant la mise en place de sous-distributeurs
- Des groupes de population en pleine croissance
Explorer les ensembles de données et effectuer l'analyse
Il s'agit d'une partie importante du processus. Commencez par explorer les sources de données et dressez la liste de ce qui est disponible et de ce qui ne l'est pas (mais qui est indispensable). Dans cet exemple, nous pouvons utiliser les données du recensement des détaillants et du panel de détaillants de Nielsen avec différentes caractéristiques telles que la taille du magasin, les ventes du magasin, les coordonnées de l'emplacement du magasin, etc. Nous pouvons ensuite intégrer ces deux ensembles de données pour obtenir un certain nombre de caractéristiques significatives.
Cependant, nous reconnaissons également les lacunes de nos ensembles de données. Dans ce cas, nous pourrions constater qu'il existe une zone importante en dehors de notre champ d'action. Par conséquent, il se peut que nous ne disposions pas de certains types d'informations, comme la population, le nombre de banques, qui peut indiquer la prospérité, et d'autres données. Nous devons donc identifier d'autres sources telles que les recensements de population pour obtenir ces caractéristiques.
Ces ensembles de données sont ensuite fusionnés et soumis à un modèle de régression multiple, qui identifie les opportunités pour chaque région/localité.
Quelques itérations sont probablement nécessaires pour garantir la précision de la prédiction. Enfin, ces données peuvent être fusionnées avec les données de distribution des clients ou de première partie.
Lier les conclusions au résultat
La dernière étape consiste à relier tous les résultats des séries d'actions.
Dans cet exemple, nous sommes alors en mesure d'utiliser ces données pour dessiner les zones ou les îlots qui offrent le plus d'opportunités et qui peuvent être soutenus de manière réaliste par le réseau de distribution existant, avec seulement une légère augmentation de leur rayon et la mise en place de quelques sous-distributeurs dans les îlots en croissance.
Dans cet exemple, nous sommes en mesure de combiner plusieurs ensembles de données pour fournir une solution simple qui présente une solution claire à un objectif vaste et ambitieux. Ce qui prouve qu'il n'est pas toujours utile de commencer par un énoncé de problème, mais plutôt par un objectif positif et ambitieux.
La prochaine fois que vous vous lancerez dans un nouveau projet, donnez une chance à ce processus et commencez par un objectif ambitieux et une réflexion créative.



