データサイエンスを独学で学ぶのにオススメの本10冊!

わさび

シンガポール国立大学でコンピューターサイエンスを専攻している、わさび (@WabiSabi_Hack) です!

21世紀で最もセクシーな職業」として取り上げられることが多い、データサイエンティスト

日本でも徐々にデータサイエンスに対する理解が深まり、大学にデータサイエンスを学べる学部ができたりしています!

「最もセクシーな職業」とか言われたら、やっぱり気になるじゃないですか!笑

僕も早稲田の副専攻制度を利用してデータ解析を専攻しています!もちろんそれだけでは不十分だと思い、企業やNPOが運営している「データサイエンティスト養成講座」のようなものにも参加していました。

シンガポールに入学して、周りが統計学や機械学習を積極的に勉強している姿を見て、「あーやっぱり、少しでも勉強しておいた方がいいな!」と再確認しました。

でも、何から始めたらいいか分からないよ…!

ペンギンさん

という人に向けて、この記事では統計学の入門から機械学習やマーケティングへの応用など、初心者がデータサイエンスを学ぶのにおすすめの本を10紹介します!

データサイエンティストは最もセクシーな職業!

世界的に有名な経済誌ハーバード・ビジネス・レビューによれば、データサイエンティストは「今世紀で最もセクシーな職業である」と言われています。

また、グーグルのチーフエコノミストであるハル・バリアン氏も「今後10年で最もセクシーな職業は統計家である」と話しています!

セクシー」ってどういう意味??

ペンギンさん

わさび

明確な定義は無いけど、最も注目すべき「ホット」な分野で、データを扱うスマートな「クール」さを兼ね備えているってことかな!

データサイエンスとは?

センサー・通信機器の発達、ネットサービスの普及などにより、収集・蓄積が可能なデータの種類と量が急激に増大しております。そして、これらの膨大なデータ(ビッグデータ)から、ビジネスに活用する知見を引き出す中核人材として「データサイエンティスト」に注目が集まっております。 引用:データサイエンティスト協会

僕も「中の人」にお世話になっている、一般社団法人データサイエンティスト協会によれば、技術の発展により集められる「データ」の量が爆発的に増加しています!

今あるデータの90%は過去2年以内に集められたものだと言われており、そういったデータをどう解析して「活用するか」を導き出すのがデータサイエンティストと言うわけです!

統計学の知識から、プログラミングまで、色々なスキルを身につける必要があります。

独学で勉強するのにおすすめの本10冊!

わさび

ここからは実際に、僕が授業で使ったり独学で勉強するのに使ったおすすめの本を紹介していきます!

初級編3冊:統計学の理解

統計学が最強の学問である

インパクトのあるタイトルですが、中身はとっても実用的!統計学を、心理統計学やデータマイニングなどから紐解く新しい切り口で、「統計学って何?」という書初心者におすすめの一冊です!

その数学が戦略を決める

タイトルは難しそうですが、ワインの値段を予測したり、航空券の最安値を予測したり、統計学を実用的な観点から理解できます。どうして今「絶対計算」 が重要になって来ているのか、一見の価値があります。少し古い本なので、中古であれば格安で購入できますよ!

原因と結果の経済学

「メタボ」と「長寿」に因果関係はあるのか、テレビを見るか見ないかは子供の学力に影響があるか、原因と結果から考えてみます。そもそも、因果関係と相関関係を理解していない人は、本当に損をしていると思います!めちゃめちゃ面白いので、ぜひ読んでみてください。

中級編3冊:トレンド技術の理解

ビッグデータの正体

ビッグデータという言葉の意味を正しく理解していない人は、意外と多いと思います。この本は、なぜデータをたくさん集められるといいことがあるのか?と言う初歩的な質問に答えてくれる良書です!

グーグルに学ぶディープラーニング

人工知能・機械学習・ディープラーニング、最近よく聞く言葉ですが、しっかり違いを説明できますか? Google の技術を通じて、これらを読み解く一冊です。とても分かりやすく書いてあるので、初めての方にもオススメです!

PythonユーザのためのJupyter[実践]入門

Jupyter とは、Pythonを使いデータ解析を行うツールの一つです。僕も実際にデータ解析を行う時は、このJupyterを使っています!

上級編3冊:データ解析の実践

データサイエンティストの秘密のノート

高橋威知郎さんは、ソフトバンクテクノロジーのコンサルタントであり、データサイエンティスト養成講座の講師を務めるなど有名な方です。実際に業務現場から見えてくる課題を消化していく、まさに「秘密のノート」です。

Rによるデータサイエンス

大学の授業で、データ解析をする時は「R」と言う言語を使うことが多いです!「Python」とは、また違った使い勝手なので、面白いと思います!

前処理大全

最も新しい本で、実はまだ僕も読んでいないのですが、知り合いのデータサイエンティストの方にオススメされた一冊です。データ解析の90%は、前処理であると言われおり、まさに辞書的に活用できる一冊だと思います!

ビジネス編1冊:マーケティングへの応用

データ・ドリブン・マーケティング

ビジネスの意思決定の場においても、「データ」によるエビデンスを示すことが重要だと思います!Amazonは積極的にデータの価値を活用していて、データによるマーケティングを推進しています。データサイエンスがビジネスにおいて、どう活かされているかを学べる一冊です!

オンライン学習もオススメ!

本だけでなく、オンライン学習サイトも活用することで、独学でもデータサイエンスを体系的に学ぶことができます!「世界最大級のオンライン学習サイト Udemy」には、Pythonを使った実践的な講座がたくさんあるので、オススメです!

\ Try Now /
「Udemy」公式ホームページ

まとめ

わさび

例え、データサイエンティストにならなくても、今後絶対に必要になるスキルだと思います!僕もまだまだ勉強していこうと思います!