Nous vivons dans un monde où les données augmentent de manière exponentielle, et où de plus en plus d'efforts sont déployés pour en faire un meilleur usage. Les spécialistes du marketing disposent aujourd'hui de plus de données qu'il n'en faut, mais ils recherchent de meilleures façons d'utiliser et de connecter leurs ensembles de données pour obtenir des informations plus approfondies et plus précieuses.
Le défi réside dans notre façon d'envisager l'application de la science des données et dans la manière dont nous, en tant que data scientists, avons été formés. En travaillant au fil des ans sur des projets de science des données et d'analyse, j'ai pu voir un moyen plus facile d'atteindre des objectifs plus grands et plus audacieux.
C'est un processus en quatre étapes :
- Commencez par un résultat ambitieux
- Décomposer le résultat en petites actions
- Explorer les données et effectuer l'analyse (itératif)
- Relier les résultats à l'objectif fixé
Ce processus fonctionne mieux que le processus traditionnel de résolution des problèmes de la science des données, car il réduit l'ambiguïté et alimente la volonté de résultat de toutes les personnes impliquées. Le processus traditionnel de science des données commence généralement par l'identification de l'énoncé du problème, puis se poursuit par la collecte, la modélisation et l'évaluation des données. La complexité est au cœur du processus traditionnel de la science des données. La complexité nous oblige généralement à penser de manière plus rationnelle et analytique et ne nous fait pas utiliser notre créativité. L'ambition, en revanche, nous encourage à commencer par la pensée créative, puis à nous tourner vers le côté analytique de notre cerveau.
Maintenant, décomposons notre processus en étapes individuelles.
Commencez par un résultat ambitieux
Disons que vous souhaitez obtenir 5 % de parts supplémentaires au cours de l'année prochaine. Tout d'abord, définissez votre objectif ambitieux. Dans ce cas, 5 % de parts supplémentaires. Selon la psychologie comportementale, il est important de recadrer l'objectif de manière positive, car cela incite votre esprit à penser de manière plus créative afin d'atteindre vos objectifs.
Dans cet exemple, disons que vous souhaitez augmenter votre part de marché en développant votre réseau de distribution en Indonésie. L'Indonésie est un pays très fragmenté géographiquement, avec 17 000 îles, et le transport est un défi. Pour y parvenir, l'objectif est d'atteindre de 50 % à 80 % du marché au coût le plus bas possible et tout cela en l'espace d'un an.
Décomposez votre résultat en plus petits ensembles d'actions
C'est essentiel car vous voulez diviser votre grand résultat ambitieux en ensembles plus petits et gérables. Il est également utile de classer vos données dans des ensembles "mutuellement exclusifs et collectivement exhaustifs". Cela permet de le diviser en plusieurs sous-objectifs et d'accélérer le processus. Dans notre exemple, nous avons divisé le résultat en trois ensembles d'actions :
- Zones géographiques denses nécessitant la mise en place de distributeurs
- Géographies dispersées nécessitant la mise en place de sous-distributeurs
- Groupes de population en croissance
Explorer les ensembles de données et exécuter l'analyse
C'est une partie importante du processus. Commencez par explorer les sources de données et dressez la liste de ce qui est disponible et de ce qui ne l'est pas (mais qui est indispensable). Dans cet exemple, nous pouvons utiliser les données du recensement des détaillants et du panel de détaillants de Nielsen avec différentes caractéristiques comme la taille du magasin, les ventes du magasin, les coordonnées de l'emplacement du magasin, etc. Nous pouvons ensuite intégrer ces deux ensembles de données pour obtenir un certain nombre de caractéristiques significatives.
Cependant, nous reconnaissons également les lacunes de nos ensembles de données. Dans ce cas, nous pouvons constater qu'il existe une zone importante en dehors de notre champ d'action. Par conséquent, nous pourrions ne pas disposer de certains types d'informations, comme la population, le nombre de banques, qui peut indiquer la prospérité, et d'autres données. Nous devons donc trouver d'autres sources, comme les recensements de population, pour obtenir ces caractéristiques.
Ces ensembles de données sont ensuite fusionnés et soumis à un modèle de régression multiple, qui identifie les opportunités pour chaque zone/localité.
Quelques itérations sont probablement nécessaires pour garantir l'exactitude de la prédiction. Enfin, ces données peuvent être fusionnées avec les données de distribution du client ou de la première partie.
Relier les conclusions au résultat
L'étape finale consiste à lier tous les résultats des ensembles d'actions.
Dans cet exemple, nous sommes alors en mesure d'utiliser ces données pour dessiner des groupes de zones/blocs qui offrent le plus d'opportunités et qui peuvent être soutenus de manière réaliste par le réseau de distribution existant avec seulement une légère augmentation de leur rayon et la mise en place de quelques sous-distributeurs dans les groupes en croissance.
Dans cet exemple, nous sommes en mesure de combiner plusieurs ensembles de données afin de proposer une solution simple et claire à un objectif vaste et ambitieux. Cela montre qu'il n'est pas toujours utile de commencer par un énoncé de problème, mais plutôt par un objectif positif et ambitieux.
Ainsi, la prochaine fois que vous vous lancerez dans un nouveau projet, donnez une chance à ce processus et commencez avec un objectif ambitieux et une pensée créative.