本コンテンツへスキップ
インサイト>オーディエンス

データサイエンスの真の魔法

3分で読めるシリーズ|データサイエンス担当シニアバイスプレジデント ケビン・ライオンス|2019年8月号

SF作家のアーサー・C・クラークが提唱したように、「十分に進歩した技術は魔法と見分けがつかない」のであれば、データサイエンスは帽子からウサギを取り出すようなものだと思われることがあります。もちろん、このような見方は間違っています。これは、私が「データマジック」と呼んでいるもので、「データサイエンス・マシン」の片方にデータを送り込めば、もう片方から完璧なウィジェット(みんなの問題に対する解決策)が出てくると人々が信じているものです。

かなりの程度、大多数の人がデータサイエンスの仕組みを理解していないからです。深層学習など、より高度な領域に入ると、多くのデータサイエンティストでさえ、多くのレベルの複雑さを理解していないことを認めるでしょう。しかし、データサイエンティストであれば、(大抵の場合)自分が手に負えないときに知ることができる程度の知識は持っているものです。しかし、データサイエンスのコミュニティーの外では、必ずしもそうではありません。それは理解できる。

それは、私たち自身のせいでもあるのです。データサイエンスは、歴史的に "部外者 "が入り込むのが難しく、ましてや理解するのは難しいクラブなのです。データサイエンスの言語は、胸の奥にしまい込まれてきた。ローマ・カトリック教会が、特に中世から近世にかけて、メッセージングを統制するためにコミュニケーションの中核となる言語として教会用ラテン語を選択したように、私たちデータサイエンティストも同様の行為で非難されるかもしれません。しかし、16世紀の改革によって言語の束縛が解かれ、キリスト教の各教会の教義が大衆の手に届くようになったように、データサイエンスは今、その言語をさらに広げなければなりません。 

共有言語があれば、データサイエンティストがどんな問題でも解決できる神秘的な能力を持っていて、データをAI環境に通すと、まるで魔法のように望ましい結果が得られると信じていることから脱却できるだろう。データサイエンスは魔法のような万能薬ではないことを、人々が理解できるようになるのです。

実際、本当に高度なデータサイエンスを求めるのであれば、孤立した問題やアドホックな問題を解決するためにデータサイエンティストを配置することは、データサイエンスを奥の部屋に閉じ込めてコミュニケーションをサイロ化することになり、最もやってはいけないことの1つです。

むしろ、データサイエンスを普及させる最善の方法は、企業レベルの問題を明らかにし、正しく行えば、データサイエンスはチームスポーツであることを理解することです。製品や顧客に特化した学際的なチームを持つことは、優れたビジネス成果を生み出し、部門横断的な理解を深めることにつながります。コマーシャルアソシエイト、プロダクトマネージャー、エンジニア、データサイエンティスト、その他の主要な機能組織の代表者を含む集団は、最大のニーズとチャンスに焦点を当てた意見交換のために、中断のない部屋に閉じ込める必要があります。これこそが、真の魔法が起こる場所なのです。

しかし、この旅をする人は、警告のサインを認識する必要があります。クライアントやその他の第三者と協働する際に、誰にでも説明できるような解決策を探し始めたら、一旦立ち止まってください。マジシャンが初歩的なトリックに限定してパフォーマンスを行わないように、データサイエンティストも簡単に説明できる解決策をデフォルトにしてはならないことを観客は理解しているのです。意図的に水を差すことは、問題に対して最適とは言えない解決策を提供するという副次的な効果をもたらすかもしれないのです。バランスなのです。

このバランスは、企業がデータサイエンティストの能力を信頼することにかかっています。データサイエンティストは、できる限り我々の言葉を共有するが、技術的に難しくなっても解決策が希薄にならないこと、そして常に我々の専門分野に忠実であることを信じること。

この記事は元々Mediumに掲載されたものです。 ミディアム.