Vivimos en un mundo en el que los datos crecen exponencialmente, y cada vez se dedican más esfuerzos a hacer un mejor uso de ellos. Hoy en día, los profesionales del marketing disponen de datos más que suficientes, pero buscan mejores formas de utilizar y conectar sus conjuntos de datos para obtener perspectivas más profundas y valiosas.
El reto radica en la forma en que vemos la aplicación de la ciencia de datos y la forma en que nosotros, como científicos de datos, hemos sido formados. Trabajando a lo largo de los años en proyectos de analítica y ciencia de datos, he podido ver una forma más fácil de alcanzar objetivos más grandes y audaces.
Es un proceso de cuatro pasos:
- Empezar con un resultado ambicioso
- Divida el resultado en grupos de acciones más pequeños
- Explorar los datos y realizar el análisis (iterativo)
- Vincular las conclusiones al resultado fijado
Este proceso funciona mejor que el proceso tradicional de resolución de problemas de la ciencia de datos porque reduce la ambigüedad y fomenta la búsqueda de resultados entre todos los implicados. El proceso tradicional de la ciencia de datos suele comenzar con la identificación del enunciado del problema, para pasar después a la recopilación de datos, el modelado de datos y la evaluación. El núcleo del proceso tradicional de la ciencia de datos es la complejidad. Por lo general, la complejidad nos obliga a pensar de forma más racional y analítica y no nos obliga a utilizar nuestra creatividad. La ambición, en cambio, nos anima a empezar por el pensamiento creativo y luego avanzar hacia nuestro lado analítico del cerebro.
Ahora dividamos nuestro proceso en pasos individuales.
Empezar con un resultado ambicioso
Supongamos que quiere conseguir un 5% de cuota adicional en el próximo año. En primer lugar, defina su ambicioso resultado. En este caso, un 5% más de cuota. Según la psicología conductual, es importante replantear el objetivo de forma positiva, ya que induce a la mente a pensar de forma más creativa para conseguirlo.
En este ejemplo, supongamos que quiere aumentar su cuota ampliando su red de distribución en Indonesia. Indonesia es un país muy fragmentado geográficamente, con 17.000 islas, y el transporte es todo un reto. Para conseguirlo, el objetivo es llegar del 50% al 80% del mercado al menor coste posible y todo ello en el plazo de un año.
Divida sus resultados en acciones más pequeñas
Esto es fundamental porque lo que se pretende es dividir un resultado grande y ambicioso en conjuntos más pequeños y manejables. También es útil dividir los datos en conjuntos "mutuamente excluyentes y colectivamente exhaustivos". Esto ayuda a dividirlo en múltiples subobjetivos y a acelerar el proceso. En nuestro ejemplo, hemos dividido el resultado en tres conjuntos de acciones:
- Geografías densas que requieren la instalación de distribuidores
- Geografías dispersas que requieren subdistribuidores
- Agrupaciones de población en crecimiento
Explorar conjuntos de datos y ejecutar el análisis
Esta es una parte importante del proceso. Empiece por explorar las fuentes de datos y haga una lista de lo que está disponible y lo que no (pero es imprescindible). En este ejemplo, podemos utilizar el censo de minoristas de Nielsen y los datos del panel de minoristas con diferentes características como el tamaño de la tienda, las ventas de la tienda, las coordenadas de ubicación de la tienda, etc. A continuación, podemos integrar estos dos conjuntos de datos para obtener una serie de características significativas.
Sin embargo, también reconocemos dónde nuestros conjuntos de datos se quedan cortos. En este caso, podríamos encontrarnos con que hay una zona considerable fuera de nuestro ámbito minorista. Como consecuencia, es posible que no dispongamos de ciertos tipos de información, como la población, el número de bancos, que puede indicar prosperidad, y otros datos. Así que debemos identificar otras fuentes, como los censos de población, para obtener estas características.
A continuación, se fusionan estos conjuntos de datos y se someten a un modelo de regresión múltiple, que identifica la oportunidad para cada zona/localidad.
Es probable que sean necesarias algunas iteraciones para garantizar la precisión de la predicción. Por último, estos datos pueden fusionarse con los datos de distribución del cliente o de origen.
Vincular las conclusiones a los resultados
El último paso consiste en unir todos los resultados de los conjuntos de acciones.
En este ejemplo, podemos utilizar estos datos para dibujar grupos de zonas o manzanas que ofrezcan las mayores oportunidades y que puedan ser apoyados de forma realista por la red de distribución existente con sólo un ligero aumento de su radio y la creación de unos pocos subdistribuidores en los grupos en crecimiento.
En este ejemplo, somos capaces de combinar múltiples conjuntos de datos para ofrecer una solución sencilla que esboza una solución clara a un objetivo grande y ambicioso. Lo que demuestra que no siempre merece la pena empezar con un planteamiento del problema, sino con un objetivo ambicioso y positivo.
Así que la próxima vez que empieces con un nuevo proyecto, dale una oportunidad a este proceso y empieza con un objetivo ambicioso y un pensamiento creativo.