本コンテンツへスキップ
02_Elements/Icons/ArrowLeft 戻るインサイト
インサイト>オーディエンス

データサイエンスの真の魔法

3分で読む|ケヴィン・ライオンズ(データサイエンス担当上級副社長)|2019年8月

SF作家のアーサー・C・クラークが提唱したように、「十分に進歩したテクノロジーは魔法と見分けがつかない」のであれば、データサイエンスは帽子からウサギを取り出すようなものだと思われることがある。もちろん、この説明は見当違いである。私が「データ・マジック」と呼んでいるのは、データを「データ・サイエンス・マシン」の一方の端に送り込めば、もう一方の端に完璧なウィジェット(誰もが抱える問題の解決策)が現れると人々が信じている、という認識である。

かなりの程度、大多数の人がデータサイエンスの仕組みを理解していないからだ。ディープラーニングのようなより高度な分野になると、多くのデータサイエンティストでさえ、複雑な多くのレベルを理解していないことを認めるだろう。しかし、データサイエンティストであれば、(大抵の場合)自分が深みにはまり込んでいないことを知るのに十分な知識を持っている。しかし、データサイエンスのコミュニティの外では、必ずしもそうではない。それは理解できる。

それは私たち自身のせいでもある。歴史的に "部外者 "が入り込むのは難しく、ましてや理解するのは難しい。データサイエンスの言語は胸にしまってきた。ローマ・カトリック教会が、特に中世から近世にかけて、メッセージングを統制するための中核的なコミュニケーション言語として教会ラテン語を選択したように、私たちデータサイエンティストも同様の行為で非難されるかもしれない。しかし、16世紀の宗教改革が言語の束縛を解き、キリスト教の諸教会の教義を大衆がより利用しやすいものにしたように、データサイエンスは今、その言語をさらに拡大しなければならない。 

共有言語があれば、データサイエンティストはどんな問題も解決する神秘的な能力を持っていて、AI環境にデータを通すことで、あたかも魔法のように望ましい結果を出すことができると信じることから脱却できるだろう。データサイエンスは魔法のような万能薬ではないということを、人々が理解する助けになるだろう。

実際、本当に高度なデータサイエンスを望むのであれば、データサイエンティストに孤立した問題やその場限りの問題を解決させるのは最もやってはいけないことの一つだ。

むしろ、データサイエンスを普及させる最善の方法は、企業レベルの問題を明らかにすることであり、正しく行えば、データサイエンスはチームスポーツであることを理解することである。製品や顧客に特化した多分野のチームを持つことは、優れたビジネス成果を生み出し、部門横断的な理解を深める。コマーシャルアソシエイト、プロダクトマネージャー、エンジニア、データサイエンティスト、その他の主要機能組織の代表者を含む集団は、最大のニーズとチャンスに焦点を当てた意見交換のために、遮るもののない部屋に閉じ込められるべきである。ここで真のマジックが起こるのだ。

それでも、この旅の旅人は警告のサインを認識すべきである。コラボレーションの精神でクライアントやその他の第三者と仕事をする中で、絶対に誰にでも説明できる解決策を探し始めたら、ちょっと立ち止まってほしい。マジシャンがそのパフォーマンスを初歩的なトリックに限定しないように、データサイエンティストも簡単に説明できるソリューションをデフォルトにしてはならないことを観客は理解している。意図的にプロセスを水増しすることは、問題に対して最適とは言えない解決策を提供するという副次的な効果をもたらすかもしれない。バランスなのだ。

そのバランスは、企業がデータサイエンティストの能力を信頼しているかどうかにかかっている。データ・サイエンティストは、できる限り私たちの言葉を共有するが、技術的に難しくなったときにソリューションを薄めることはない。

この記事の原文は ミディアム.

類似の洞察を閲覧し続ける