2021 年のデータ サイエンスの現状: 欠かせない存在になってきたが、未知の可能性も残されている

昨年のレポート「State of Data Science」では、データ サイエンスの分野が誇大広告から成熟に向かっていることを紹介しました。2012 年に「21 世紀で最も魅力的な仕事」と称されたこの職業が、その後、誇大広告の中心となるのは必然だったのかもしれません。しかし、昨年の「State of Data Science」レポートで明らかになったように、データ サイエンティストと彼らが働く組織は、実際に測定可能な価値を生み出すための効果的な協力方法を見出しています。そうすることで、この分野は、期待されているけれども必ずしも有効に活用されているわけではない新しいオブジェクトから、企業の意思決定のインフラとして重要な役割を果たすようになってきています。

COVID-19 パンデミックは、あなたの組織のデータ サイエンスへの投資に影響を与えましたか? 50% が、投資額は変わらないか増加したと回答しました。37% は投資が減少したと答えました。13% は「わからない」と答えています。

2020 年を通して私たちに紹介された多くの新しいコンセプトの中に、”エッセンシャル・ワーカー” という考え方がありました。どのような仕事や役割がビジネスの機能に不可欠であり、その仕事がなければ会社は成り立たないのでしょうか? ”エッセンシャル (不可欠)” という考え方は、データ サイエンスが組織の最も重要な業務にどれだけ効果的に統合されているかを考える上で、有用なフレームワークとなります。

COVID-19 のパンデミック (およびそれに伴う経済的課題) によって、ここ数年注目されている分野への需要が減退するのではないかという憶測が流れている中、Anaconda は「2021 State of Data Science Survey」の回答者に、その影響について尋ねました。パンデミックの影響で、組織のデータ サイエンスへの投資額は変わらないか増加したと答えたのは 50%、減少したと答えたのは 37% でした。この時期に投資が増えた企業では、データ サイエンスの予算が増えた、積極的に採用した、プロジェクトが増えた、プロジェクトのスケジュールが早くなった、などの例が挙げられています。これは、弊社の Anaconda 利用データに見られる傾向と同じで、2020年3月から2021年2月の間に 46 億件のパッケージがダウンロードされ、前年比で48% 増加しています。

今回の調査では、回答者の半数が、過去 1 年間に組織からの投資が安定または増加したと回答しており、データ サイエンスがビジネスの現場で真価を発揮していることを示しています。このことは、今年の「State of Data Science」調査で、回答者の53% が、自社のビジネス上の意思決定の多くまたはすべてが、データ サイエンティストが解釈した洞察に基づいて行われていると回答したことにも表れています。

これらの結果は、データ サイエンスが組織にとって ”不可欠” なものになりつつあることを示唆していますが、同時に、この分野にはまだ成長の余地があることも示しています。回答者の 37% が、パンデミックの影響でデータ サイエンスへの投資を減らしたと答えています。昨年の厳しい経済状況の中で、全面的な削減を余儀なくされた企業もあったでしょう。しかし、削減を避けられたかもしれない分野において、データ サイエンスが投資を中止した理由を説明するには、どのような要因が考えられるでしょうか。

これらの企業では、ビジネス チームとデータ サイエンス チームの間に大きなコミュニケーションと理解のギャップがあり、それがデータ サイエンティストの仕事の効果を低下させていることが考えられます。例えば、ビジネス上の意思決定に影響を与える能力を制限している要因について尋ねたところ、回答者の 33% は、ビジネスの専門家が急速に変化していることを指摘し、25% は組織の意思決定者がデータ リテラシーに悩んでいることを指摘し、11% はビジネス上の影響を示すことができないことが制限になっていると答えました。また、25% が「効果的な分析のためのリソース不足」を根本的な原因として挙げています。しかし、これは、ビジネス リーダーとデータ サイエンス リーダーの間に、適切なツールとは何かを理解する上でのギャップがあることを示しています。

本レポートの結果によると、このギャップを埋め、より効果的な共同研究行うためには、双方に課題があるようです。ビジネスの観点からは、リーダーはデータ リテラシーを高めることに時間を費やし、組織のデータ サイエンティストの役割と仕事をよりよく理解する必要があります。今年の「State of Data Science」レポートでは、組織の意思決定者が非常にデータ リテラシーが高く、ビジュアライゼーションやモデルが語るストーリーを理解していると答えた回答者は、わずか 36% でした。励みになるのは、52% が、組織の意思決定者はほとんどデータ リテラシーを持っているが、可視化やモデルが語るストーリーについてはコーチングが必要だと答えたことです。とはいえ、この分野にはさらなる成長の余地があり、それがビジネス全体の利益につながると考えられます。

一方で、データ サイエンティストは、より効率的かつ成功裏に業務を遂行するために、ビジネスに対する理解や関連する分野の知識を深める努力をする必要があります。今回の調査では、「あなたの組織のデータ サイエンス/ML 分野で不足している重要なスキルや知識は何か。」という質問に対して、回答者の約 4 分の 1 が「ビジネス知識」を挙げています。また、「データ サイエンスを学ぶ学生が学校で何を学ぶか。」という質問では、「ビジネス知識」が比較的低い順位になっています。データ サイエンティストは、自分が発見したことを明確かつ説得力のある方法で説明できる優れたストーリーテラーになることを学ばなければなりません。これらのソフト スキルを身につけることで、データ サイエンティストは組織にポジティブな影響を与え、日常業務に「必要不可欠」な存在になることができます。今年の調査では、Generation Z の回答者数が 2020 年に比べて 15% 増加していることから、教育カリキュラムにこれらのスキルをより効果的に組み込むことで、学生がプロフェッショナルとしてこの分野に参入するための準備を整えることができるという明確な機会があります。しかし、経験豊富なデータ サイエンティストは、継続的な専門能力開発の一環として、ソフト スキルのさらなる向上にも時間を費やすべきです。

データ サイエンス コミュニティの一員として、これほどエキサイティングな時代はありません。Anaconda では、あらゆる分野のデータ サイエンティストの進歩とサポートを支援し、引き続き我々の役割を果たしていきたいと考えています。まだまだ可能性は残されていますが、データ サイエンティストが組織にとって不可欠な存在となり、ビジネス価値を提供し、この分野を新たな発展の場へと押し上げようとしていることは明らかです。来年、どのようなトレンドや変化が起こるのか、今から楽しみです。

データ サイエンティストがどのように時間を費やしているか、どのプログラミング言語が最も普及しているか、今日の実務者の関心事など、2021年版「State of Data Science」レポートの全文はこちら (英語) をご覧ください。


Anaconda は機械学習、AI 向け Python/R プラットフォームです。7,500 以上の Anaconda で構築された信頼性の高いデータ サイエンス/機械学習パッケージを活用し、データ サイエンスの世界で難関とされるあらゆる問題を解決します。Anaconda に関する詳細はこちらからご参照ください。


参照記事: State of Data Science 2021: Becoming “Essential,” Though Untapped Potential Remains