2019年4月17日水曜日

日本でデータサイエンティストが育たない理由


本を読んでいて、表題のごとく、データサイエンティストがなかなか育たない理由?が列挙されてあった。

 筆者も読んでそうだろうなぁ、と納得した。
 核心は、「理屈」と「実務」の間を、データサイエンティストなる者が、うまく繋ぐことができない—という部分にあるのだろう。

 まず、肝心な部分を抜粋。

1.分析スキルを蓄積するのが難しい
 ビジネスでのデータ分析は、学問とは違う。実際に経験しないと気がつかないことが多い。
 各手法で簡単にできそうでも、さまざまな壁にぶっかる。

2.ビジネスでの分析のノウハウが少ない
 統計手法の理論は、数式が並んでいる。その理論をビジネスデータに適用しようとすると、多くの場合うまくいかない。手法の仮定している条件が揃っていない、時間がかかりすぎる、複雑で他者の理解を得られない。
 経営コンサルタントが発信している情報は、成功例を伝えている。しかし、実際の実務と概論には乖離がある。成功事例をみて、うちでもと思っても、具体的に何をすれば良いのか分からない。
 ツールの使い方は分かったけど、実際のデータでどうすれば良いのか分からない。

 つまり、データ分析の情報は、知識としてのデータ分析であり、具体的なビジネスデータ分析のノウハウは殆どないとういう状況。

3.データの前処理
 分析をするためのデータの加工が必要。
 問題となるのが、データの不整合。問題点を解消するための加工は、泥臭い作業。

4.分析ツールの使い分け
 どの場面でどのツールを使うのかという使い分けの情報は乏しい。

5.経験を積む機会が少ない。
 実務経験を通して、知恵を身に付け、蓄積・体系化できて、人材が生まれるはず。
 また、意思決定に関わるために新人が携わりにくい。

6.分析スキルとビジネス価値
6-1.高度な分析手法を使って、高精度な結果をだしても、そこにビジネス価値があるとは限らない。かといって、シンプルな手法だけでは、分析スキルが向上しない。
6-2.データ分析において、ビジネスでの価値をだすためには、対象プロジェクトの目的を把握した上で、最適な手法を選択して、取り組む必要がある。

感想など

 日本でのデータサイエンティストの歴史が浅いためという理由もありそうだ。

 Rというツールを使っていると、半世紀前の大学生の頃、先生がタイガー計算機とかいう手回しの計算機を使っておられたことを思い出した。
 ちょいとした計算がどれだけ大変だったか---

 以後、電卓とか、エクセルとかを使いながら暮らし、今、Rというツールを使っている。
 この高級電卓?の有り難みを思いつつ、データサイエンティスト?(もどき)に近づくことを願っている。