「仕事にデータサイエンスが役立つ」は本当なのか、具体的な活用術を実際のデータサイエンティストに聞いてみた
データサイエンスやIoTなどに関わる「先端IT人材」は、経済産業省の(PDF)調査では「2030年に45万人が不足する」と言われていますが、「そもそもデータサイエンスって何?」「普通に仕事するだけなら必要ないのでは?」という疑問を抱く人も多いはず。ちょうど5周年キャンペーンを実施しているオンライン学習プラットフォーム「Udemy(ユーデミー)」に「データサイエンスの資格のための講座」が開設されたとのことなので、技術者や経営者でない人にもデータサイエンスは必要なのか、具体的にどう役立つのかを、まさにその資格の開発に携わった堅田洋資さんと石田祥英さんにイチからいろいろ話を聞いてみました。
オンラインコース - いろんなことを、あなたのペースで | Udemy
https://www.udemy.com/
目次
◆1:そもそも「データサイエンス」って何?
◆2:「データサイエンス」でビジネスはどう変わるのか?
◆3:「データサイエンス」を学ぶことの魅力とは?実務家から見たリアル
◆4:ビジネスパーソンが「教養としてのデータサイエンス」を身につけるには?
◆5:オススメUdemyデータサイエンス講座まとめ
◆1:そもそも「データサイエンス」って何?
GIGAZINE(以下、G):
本日はよろしくお願いします。さっそくですが、お二人は「データサイエンティスト」という肩書きですが、これまで、どのような仕事をご経験されてきたんですか?
堅田洋資氏(以下、堅田):
自分で会社を立ち上げる前は白ヤギコーポレーションという会社に在籍し、ニュースアプリのレコメンデーションエンジン開発といった業務に携わっていました。その前は監査法人のトーマツで、会計士が企業の不正を調べる際に活用するデータの収集と分析を担当していました。サンフランシスコに留学してデータサイエンスの修士を取得したのはさらにその前になります。現在はデータミックスという会社を立ち上げ、データサイエンティストの教育や研修事業、コンサルティング事業などを行っています。
石田祥英(以下、石田):
私のファーストキャリアはエンジニアで、広告配信のバックエンドシステムや女性向けマガジンのアプリなど、インフラに近い技術からモバイルアプリまで幅広く経験してきました。エンジニア時代から、どうすればサービスを利用してもらえるのか、どうすればユーザーの反応が良くなるのか、といった分析にデータを使っていましたが、データ分析を本業にし始めたのはメルカリのデータアナリストチームに所属した時からです。メルカリでは、マネージャーとしてアプリ全体のログ設計から、データの用途設計、アナリストのマネジメントおよび育成などに関わっていました。
G:
最近は「データサイエンス」「機械学習」といった言葉をよく耳にしますが、そもそもデータサイエンスってどういうものを指すのでしょうか?
堅田:
「データサイエンス」という言葉は2010年代に入ってから急速に広がった言葉で、そのきっかけは「ビッグデータ」でした。「仮説を立てて、理論を作って、検証する」といったデータサイエンスに加えて、膨大なデータからパターンを抽出して知見を引き出すという活動もデータサイエンスの一つの取り組みだと考えています。
G:
データサイエンスを扱うには、機械学習や、プログラミング言語であるPythonやRを理解する必要があるのかと思ったのですが……。
石田:
Pythonや機械学習、AIというのはあくまでもデータサイエンスにおける「手段」の話であって、データサイエンスの骨子は、基本的には「データを使って経営や事業を科学していくこと」になります。一言で言うと、「意思決定や顧客理解のデジタルトランスフォーメーション(DX)」かな、と。意思決定をする際にきちんとデータを見て決めようよ、というわけですね。昨今は大規模なデータの取得や処理、計算が簡単にできるようになってきたので、事業上の意思決定の領域がデータを用いるテクニカルなITの領域と重なるようになってきたというわけです。
堅田:
ただ、データサイエンスという言葉の中に「機械学習」や「AI」といった意味も含まれていれば、「従来からコンサルティングの現場で行われていたデータ利用の延長線上にあるもの」という意味も含まれているので、けっこう定義はあいまいなんです。
G:
データサイエンスについての定義としては「ハッキングスキル・数学と統計学の知識・実質的な専門知識の重なりあう領域」とするドリュー・コンウェイのベン図が有名です。これを見ると「データサイエンティストはこんなにも広い領域のプロフェッショナルなのか」と思ったのですが……。
石田:
「データ」という言葉自体が一人歩きしているのが現状かと思います。というのも、データを扱う際には事業やプログラミング、統計学なども含んだ横断的な分野であり、かつ新しい分野なので、教科書にあたるものも少ないです。現場のノウハウも局所的にしかたまっていないので、実は企業ごとにデータサイエンスの定義が異なってきているというのも事実です。
私が所属していたメルカリでは、データを分析するツールは個人が選べるようになっていました。「いい企画を出す」とか「いい戦略を立てる」という目的が達成できるのであれば、ツール自体は問題ではないのかなと。
堅田:
データサイエンス「である」ものと、データサイエンス「でない」ものの違いを考えるといいかな、と。私はデータを分析した結果が意思決定に使えるかどうか、ビジネスの世界に持ち込めるかどうかが境界線だと思っています。もちろんアカデミックな研究も大切ですが。石田さんはどう考えますか?
石田:
何がデータサイエンスで何がデータサイエンスでないか、という問いはけっこう難しい問題ですが、「RやPythonといったプログラミング言語を使えればいい」といった、そういう「手段ありき」ではサイエンスにはならないと考えています。サイエンスというのは解き明かしたい問題があって、それに対して答えを出すものだと思うのですが、それは事業も同じです。事業の問いに答えを出せなければとサイエンスじゃないかなと。
わかりやすい話をすると、「データサイエンティスト」と呼ばれる人が作成したレポートを見て、あなたの行動が変わりましたかと問われた時に「イエス」であればデータサイエンス、「ノー」であれば趣味なのかなという感じですね。手段としてのスキルだけを伸ばすのではなく、手段と達成すべき「目的」をうまく結びつけるのが大切です。単純なことでもデータを使って何かを達成することが条件なのではないかなと。
G:
集めたデータをPythonやRなど、手段はなんでもいいから分析してみて、それを経営や事業の意思決定に役立てるのがデータサイエンス、というわけですね。
◆2:「データサイエンス」でビジネスはどう変わるのか?
G:
そのデータサイエンスが今の世の中に必要とされているのはなぜなのでしょうか?
堅田:
企業同士の競争が激しくなっている中で、再現性がある形で事業の戦略や意思決定をしていきたいというニーズの表れではないかと思っています。
石田:
「鉄を作れば必ず儲かる」という時代は鉄を作ればいいんですが、サービス業がメインとなった今の時代は「何がユーザーにウケるのか」を考える必要があります。リリースしたサービスが「ウケている」か「ウケていない」かは、データを見ればわかりますし、「この調子だと1年後の収支はいくらだ」ということもわかるので「それじゃ全然事業としてダメだよね」という議論が起こり、事業を閉じるべき、もしくはテコ入れをすべきという判断ができます。
今、データサイエンスが必要とされている理由としては、「不確実性の高い事業に対してスピーディーに判断できるツールが出たんだから、使わない手はない」ということかなと。
G:
不確実な時代だからこそ、データという客観性のある事実から事業方針を導き出していきたいというニーズが高まっていると。経営者目線でいくと納得なのですが、普通に働くビジネスパーソンに必要なデータサイエンスとはどんなものでしょうか?
堅田:
企業が成長しなければ、当然そこに勤める社員の給料が増えることもありません。企業の中で自分たちが何をやるべきか、というのは社員全員が意識しているはずです。つまり、目標を達成するためにはどうすればいいか、という「問い」を立てるのはあらゆるビジネスパーソンがやっているはずなので、問いに対する答えを与えるデータサイエンスはビジネスパーソン全員に必要なんじゃないかなと。
G:
具体的にはどんな例が考えられますか?
石田:
例えばGIGAZINEでは「次の記事1本当たりどれだけの売上が上がっていることが望ましいのか」という問いが立てられますよね。それをインプレションや回遊率や読了率などにブレイクダウンしていくと、原稿段階で「この記事のクオリティじゃダメだ」みたいな議論が生まれると思うんですよ。また、ページあたりのスクロール数や読了率、滞在時間といったデータがダッシュボードなどで常にシェアされている状態にあると、今やるべきことはリピーターを増やすことなのか、新規の読者層を獲得することなのか、とか。データを日頃から積極的に用いることによって「これで本当にいいんだっけ?」と社員ひとりひとりが考える材料になるかなと思います。
G:
企業の中には事業の損益予想をどんぶり勘定で行ったり、企画の費用対効果を単純に似た事例から引っ張ってきたりといったケースもありますが、それではこの先の競争力も衰えますし、ひとりのビジネスパーソンとしても不利益が出てくると。
堅田:
データ活用の知識がまったくない人は、この先立ちゆかなくなっていくと思います。ECやウェブサイトを持っていない企業って、今ではほとんどないじゃないですか。デジタルとビジネスは切っても切り離せない状況になってくると、それに付随してデータの活用も当たり前になっていく。競合他社がデータを活用していれば、データ活用のスキルなしでは事業を伸ばせないし、社員の待遇も良くならない。非常にクリティカルな知識になりつつあると思います。
石田:
データがない状態でビジネスをやるのは「スイカ割り」のように目隠しをしている状態と同じかなと思っています。ユーザーはどのような行動をしているのか、分布はどのようになっているのか、というのが見えないと、ユーザーそのものを理解できません。データサイエンスができるのは意思決定のDXです。DXってどこもかしこも言っていて「ちょっと言い過ぎでは?」と思うこともありますけど。
私はエンジニア出身なので、サービスを作ってリリースしても全然使ってもらえないという経験を何度もしたことがあるんですよね。それってすごく悲しいことなんです。データサイエンスの知識があれば、設定した仮想のユーザーが本当にいるのかが企画を出した段階でわかるので、まず企画自体が外れない。ちゃんと当たる企画をみんなが納得できるかたちでやれるんです。データを使うことで得られる恩恵があるのに使わない手はないのかな、と。
◆3:「データサイエンス」を学ぶことの魅力とは?実務家から見たリアル
G:
堅田さんの他のインタビューでは「受講生が転職して年収が180%上がった」というお話もありましたが、お二人はデータサイエンスを身につけたことによって、具体的に「報酬が上がった!」という経験はありますか?
堅田:
私は転職を7回経験しているので、上がったり下がったり、という感じですね。給料の上下がデータサイエンスによるものなのかは、正直よくわかりません(笑)
石田:
データサイエンスに力を入れている企業って、今まさに上り調子なはずなんですよね。そういうところに転職するためのスキルアップとしてはアリなんじゃないかなと。「意思決定のデジタル化」という流れは今後も続いていくので、確実に未来はありますし、報酬も上がっていく余地はあります。
G:
データサイエンスを活用する中で、「まわりの目が変わったな」と感じた経験はありますか?
堅田:
データサイエンスをやっていると、全て数字に基づいて話ができるので「おっ」と思われている気分にはなります。
石田:
データがたまってさえいれば、今あるデータから答えを類推できるというのは、「すごい」と思われる可能性があると思いますし、少なくともかつての自分は「すごいな」と思ってましたね。
堅田:
「DX推進部」や「AI推進室」を新しく作っている大企業に対して「データの活用」に関する研修をよく行うのですが、意外にも「問い」を素早く出せるという点をすごいと思われているような気がします。学べば学ぶほどシンプルな「問い」や、いいところを突く「問い」を出せるようになる。データを分析していくと「こういう問いだと解けそう」みたいなことがわかってくる。そこは評価されているのかなと。もちろん「技術」の部分もそうなんですけどね。
◆4:ビジネスパーソンが「教養としてのデータサイエンス」を身につけるには?
G:
お二人とも最初はコンサルやエンジニアといった別職種からのキャリアチェンジということですが、最初にデータサイエンスを学ぶ上で何か苦労した点はありますか?
堅田:
最初に学ぶときはどうしてもツールやアルゴリズムといった「How」の部分に興味がいきがちだったのですが、「どういう問いを立てたらいいのか」「どう答えればいいのか」が話せないと仕事にはつながりません。そのことに気づくのが難しかったですね。PythonやR、SQLについて説明した書籍がたくさんありますが、それだけじゃなく「結局何が知りたかったんだっけ?」というところに思いをはせられるかどうか。知りたいことを明確にするためには、知りたいと思う対象物に対する理解が深くないとダメなんですよね。ユーザーの行動に対して問題を立てられないと話にならない。
受講生を見ていて、「苦しんでるな」と思うのは「何を勉強したらいいかわからん」ということ。Python、R、統計学、機械学習、流行しているAI、どこからどう手を付けたらいいかわからないという人が多いように感じます。「だいたい全体としてこんな感じなのね」と思えるようになるのが大切です。
石田:
初学者が苦労する点について、私は3つあると思っています。1つ目はデータサイエンスが横断的な領域ということ。データベースの知識も必要だし、プログラミングの知識も必要だし、ビジネスを成長させるといった知識も必要だし。ゼロから始めるとなると多岐にわたる分野です。全てを深く網羅した教材もなかなかありません。2つ目は「ビジネス上の問いがわからない」点。何に対して答えを出せばいいかがわからない。3つ目が「データがない」という点。やってみようと思っても「データがない」という問題があって、それはデータを仕掛けるところから始めることになるかな、と思っています。
堅田:
「ビジネス上で知りたいこと」と「データで分析できること」を結びつけなきゃいけないというのが重要な点で、データで何ができるかというのを把握するのはハードルが高いというか、一定以上勉強しないとわからないし、勉強しにくいんですよね。
G:
そうした壁を乗り越えて「データサイエンスって全体としてこんな感じなのか」と思えるようになるためにはどうすればいいのでしょうか?
石田:
まずは「1つずつやる」というのが方針かなと思っています。企業内でできることとしては、事業の数値を把握する、ログを取るというところが第一歩。個人レベルでは、ビジネスケース問題をやってみるのがいいのかなと思っています。コンサルティングの面接などで出題される問題を自社に当てはめてみて「どういうデータで検証できるのか」といった問題を自分で作って自分で解くとか。
堅田:
「やってみよう」という気持ちが大切ですよね。
石田:
一歩踏み出すだけで見える世界はだんだんと変わってくるので。最初は全体像をイメージできなくても、「いずれは見えるだろう」という気持ちで一歩ずつ進んでいくことが大切です。
堅田:
ただ、データサイエンスは領域が横断的すぎるのと、人によって定義がバラバラなのとで、体系的・全体的に学ぶための資格を作るのが非常に難しいんです。なので、統計資格やG検定など、色んな資格があるんですが、「ビジネスパーソンがこれくらいの知識を備えていれば、データ分析の専門家ともお互いスムーズに仕事ができる」という点を意識して「データ分析実務スキル検定(CBAS)」を作ったんですね。
CBAS データ分析実務スキル検定
https://cbas-exam.jp/
「データ分析実務スキル検定(CBAS)」とは、データ分析プロジェクトでデータサイエンティストやエンジニアといった専門家とコミュニケーションを取りながらプロジェクトを推進できるだけの基礎知識を有していることを証明する資格です。
石田:
ビジネスパーソンにとって大切なのは、専門家たちと会話ができる程度に「教養としてのデータサイエンス」を備えていることです。ちょっと話をすると「あ、この人データサイエンスに対する理解があるな」というのはわかるんですよね。データサイエンスすべてを完璧にわかるようになるまでにはけっこう経験が必要ですが、その一歩手前の段階にあたる、基本的なツールや用語、概念の理解を手助けするものとして、資格試験はとっかかりになるんじゃないのかなと。
G:
「技術を深掘りする」というよりは「備えておくべき一般教養としてのデータサイエンス」を身につけることがビジネスパーソンには必要だと。
堅田:
CBASの作成にあたって、Python使おうとかR使おうとか、議論になりましたよね。私としては「どっちでもいいじゃん」とも思うんですけど、「どっちも理解はしておいたほうがいいじゃん」という話になって。他にも利用規約や個人情報、機械学習、アナリティクス、携わっている領域によって人の意見が違うんですよね。だからこそ、その意見を整理するのが大変でした。
G:
データサイエンスの領域が広いがゆえに。
堅田:
逆にいろいろな人たちが資格に関わってくれたおかげで、一定レベルの網羅性はあると思います。データサイエンティストの「専門家」を育てるための資格ではないので、忙しいビジネスパーソンでもどこでも見られる手軽さを重要視して、CBASの対策講座はUdemyに公開しています。
【演習形式で学ぶ】「データ分析実務スキル検定(CBAS)」合格への道 | Udemy
Udemyの講座では、SQL、R、Pythonの基本的な使い方から機械学習、統計学の基礎知識、データの可視化方法まで網羅しているので、この講座を受講しておけば「教養としてのデータサイエンス」はしっかり身につくようになっています。
◆5:オススメUdemyデータサイエンス講座まとめ
G:
最後に、これからデータサイエンスを学ぶ人向けのオススメUdemy講座を教えてください。
堅田:
この辻先生の講座とか人気ですよね。これをきっかけにデータサイエンスに興味を持ってくれている人は多いんじゃないでしょうか。
【世界で18万人が受講】実践 Python データサイエンス | Udemy
先ほどのCBASの講座は基礎的な教養としてのデータサイエンスをカバーしているので、そこで基礎を固めたらPythonやRなどのツールに関する講座を受講して専門性を深めるのはアリですね。もしくはツール系の講座を先に受講して、CBASの講座で資格の全体感をつかむというのも有効だと思います。
Pythonで機械学習:scikit-learnで学ぶ識別入門 | Udemy
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門 | Udemy
3時間で学ぶ SQL ・データベース 超入門【丁寧な解説+演習問題で SQL データ抽出の基本が身につく】標準 SQL | Udemy
最初からがっつりデータサイエンスを学びたいというやる気に満ちあふれている人は、「【世界で29万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜」がオススメです。データの前処理から始まって、統計学やTensorFlowなどの機械学習ライブラリ、TableauといったBIツールまで網羅されています。こちらの講座は数式なども多用されているので、「まったく何もわからない」という人は先ほど紹介した基礎的な講座から始めるのがいいと思います。
【世界で29万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜 | Udemy
G:
「普段の仕事をやりやすくするために、データサイエンスを少しかじってみたいんだけど……」という場合はどんな講座がオススメでしょうか?
石田:
「【 初心者から財務プロまで 】エクセルで学ぶビジネス・シミュレーション講座 マスターコース | Udemy」はExcelベースの分析ですが、事業上の問いを学ぶきっかけになると思います。
【 初心者から財務プロまで 】エクセルで学ぶビジネス・シミュレーション講座 マスターコース | Udemy
堅田:
あとこれはまったくデータサイエンスには関係ないんですが、個人的には起業の仕方みたいな講座もあって、幅広い講座を取りそろえているのがUdemyの面白いところだと思っています。
元Appleエバンジェリスト、ガイ・カワサキの起業家塾(日本語字幕) | Udemy
石田:
私はデザインスキルとかも見ますね。アプリデザインなどはFigmaを使いますが、こういう手を動かしながら学べる講義はいいと思います。
初心者から始めるアプリデザイン<UI/UXデザインをFigmaでを学ぼう!>Webデザインにも応用可能 | Udemy
G:
堅田さんは他のインタビューで「趣味があるとデータサイエンティストは強い」とお話されていましたが、いろいろな分野に興味を持てるのはデータサイエンティストにとって大切ですか?
堅田:
大切です。知的好奇心がないとデータ分析はできないので、要は「勉強しようよ」ということですよね。勉強するクセがある人にとってはデータサイエンスはとても面白い分野だし、クセをつけるにはUdemyはいいプラットフォームだと思います。
◆Udemy5周年キャンペーン
インタビューで登場したオンライン学習プラットフォーム「Udemy」が2020年で日本でのサービス提供開始から5周年を迎えたということで、5周年記念キャンペーンが実施されています。データサイエンスについて学びたい人、プログラミングスキルをつけてキャリアアップしたい人には絶好のチャンスです。
Udemyとは
Udemyは、「Improving Lives Through Learning(学びで人生をもっと豊かに)」を事業コンセプトとして掲げる米国法人Udemy,Inc.が運営する世界5,000万人以上が利用するオンライン学習プラットフォームです。
(2015年よりベネッセコーポレーションが日本における独占的事業パートナーとして提携を開始)
Udemyは、C to C(Consumer to Consumer)プラットフォームで世界中の「教えたい人(講師)」と「学びたい人(受講生)」をオンラインでつなげる。
最新のIT技術からビジネス、趣味まで幅広い領域の学びをオンラインで学ぶことができ、世界で約15万コース、約5万7000名の講師が登録しています。
5周年キャンペーン開催中
(感謝の気持ちを込めて、500円分のUdemyクレジットをプレゼント)
オンラインコース - いろんなことを、あなたのペースで | Udemy
https://www.udemy.com/
2020年でUdemyは日本でのサービス提供開始から5年目を迎えました。
これまでの感謝と、学びを通して新しい一歩を踏み出す皆様へのエールとして、ささやかながらUdemyの次回からのコース受講に使える500円分のクレジットをプレゼントいたします。
<5周年キャンペーンの概要>
期間:2020年7月6日~9日まで
特典①:対象のコースが1500円から割引価格で受講可能
特典②:キャンペーン期間中に有料コースを受講いただいた方全員にUdemyクレジット500円分をプレゼント(※)
※期間中に有料コースを購入された方へ2020年7月11日までにUdemyクレジット500円分と引き換えられる「コード」をメールにて送信いたします。
「コード」の引き換え及び500円分のクレジットの利用は、2020年7月11日00:00(日本時間)から2020年8月15日23:59(日本時間)まで有効です。
現金としてはお使いいただけません。期間中に複数コースを購入いただいても「コード」はおひとり様、1回の進呈となります。詳しくはUdemyサイト内の利用規約をご確認ください。
IT系資格をコンプリートしてキャリアアップもしくはサクッと転職したい人にお役立ちな資格対策講座のレビューがこれ。
2020年のキャリアアップにつながる注目のIT資格まとめ、機械学習の基本を押さえた「G検定」や人気トップのPython・AWSをオトクに学べるUdemyキャンペーン - GIGAZINE
Udemyには他にもこんな講座があります。
組織を動かす!今日からはじめるデータ分析の『超』基本 | Udemy
https://www.udemy.com/course/zokuzokuconsulting/
【数字を味方につける:初級編】ビジネスの現場で使えるデータ分析 | Udemy
https://www.udemy.com/course/data_nyumon/
【数字を味方につける:中級編】ビジネスの現場で使えるデータ分析 | Udemy
https://www.udemy.com/course/data_chukyu/
【はじめての統計学】 エクセルで学ぶマーケティング統計分析&戦略 | Udemy
https://www.udemy.com/course/marketing-statistics-excel/
はじめてのSQL ・データ分析入門 -データベースのデータをビジネスパーソンが現場で活用するためのSQL初心者向コース | Udemy
https://www.udemy.com/course/standard-sql-for-beginners/
・関連コンテンツ
in 取材, インタビュー, ソフトウェア, 広告, Posted by darkhorse_log
You can read the machine translated English article Is it true that 'data science is useful ….