我们生活在一个数据呈指数级增长的世界里,为了更好地利用数据,我们付出了越来越多的努力。如今,营销人员拥有的数据绰绰有余,但他们正在寻找更好的方法来使用和连接他们的数据集,以获得更深入、更有价值的见解。
挑战在于我们看待数据科学应用的方式,以及我们作为数据科学家所接受的培训方式。在多年的数据科学和分析项目工作中,我发现了一种更容易实现更大、更大胆目标的方法。
这个过程分为四个步骤:
- 从雄心勃勃的成果开始
- 将结果分解成更小的行动集
- 探索数据并进行分析(迭代式)
- 将研究结果与既定成果挂钩
这种流程比传统的数据科学问题解决流程更有效,因为它减少了模糊性,并激发了每个参与人员的成果驱动力。传统的数据科学流程通常从确定问题陈述开始,然后进行数据收集、数据建模和评估。传统数据科学流程的核心是复杂性。复杂性通常迫使我们更理性地分析思考,而不会让我们发挥创造力。而雄心壮志则鼓励我们从创造性思维开始,然后转向大脑的分析能力。
现在,让我们把流程分解成各个步骤。
从雄心勃勃的成果开始
比方说,您想在下一年增加 5%的份额。首先,确定您的宏伟目标。在本例中,就是增加 5%的份额。行为心理学认为,积极地重构目标非常重要,因为这会诱导你的大脑为实现目标进行更有创意的思考。
在这个例子中,假设您想通过扩大在印度尼西亚的分销网络来增加份额。印尼是一个地理位置非常分散的国家,有 17000 个岛屿,运输是一项挑战。为了实现这一目标,我们的目标是以尽可能低的成本,在一年内将市场份额从 50% 提高到 80%。
将成果分解成更小的行动集
这一点至关重要,因为您希望将庞大的宏伟成果分解成较小的可管理集。这也有助于将数据归入 "互斥的集体详尽 "集。这有助于将其划分为多个子目标,加快进程。在我们的例子中,我们将结果分为三个行动集:
- 需要设立分销商的密集地区
- 需要分销商设置的分散地区
- 不断增长的人口集群
探索数据集并运行分析
这是整个过程的重要组成部分。首先要探索数据来源,列出哪些是可用的,哪些是不可用的(但必须有)。在这个例子中,我们可以使用尼尔森零售普查和零售面板数据,这些数据具有不同的特征,如商店规模、商店销售额、商店位置坐标等。然后,我们可以整合这两个数据集,得出一些有意义的特征。
不过,我们也认识到数据集的不足之处。在这种情况下,我们可能会发现在我们的零售范围之外有一个相当大的区域。因此,我们可能无法获得某些类型的信息,如人口、银行数量(这可以表明繁荣程度)和其他数据。因此,我们必须确定其他来源,如人口普查,以获得这些特征。
然后将这些数据集进行融合,并通过多元回归模型运行,从而确定每个地区/地点的机遇。
为确保预测的准确性,可能需要进行几次迭代。最后,可将这些数据与客户或第一方分发数据合并。
将调查结果与成果挂钩
最后一步是将所有行动集的结果联系在一起。
在这个例子中,我们可以利用这些数据绘制出能够提供最多商机的区域/街区集群,这些集群只需略微扩大半径,并在不断扩大的集群中设立少数几个分销商,就能切实得到现有分销网络的支持。
在这个例子中,我们能够将多个数据集结合起来,提供一个简单的解决方案,为一个宏大的目标勾勒出清晰的解决方案。这说明,一开始并不总是要陈述问题,而是要有一个积极远大的目标。
因此,下一次当你开始一个新项目时,请给这个过程一个机会,带着远大的目标和创造性的思维开始吧。