業務・業界・技術
2021.12.9
データ分析の勉強方法は?データサイエンティストに求められるスキルも紹介
これからデータ分析を勉強しようとお考えの方で「初心者向けの勉強方法を知りたい」「データサイエンティストになるにはどの程度のデータ分析スキルが必要?」と悩みを抱えている方も多いでしょう。
そこで本稿では、初学者向けにデータ分析の有効な勉強法や勉強に役立つ資格を解説します。
また、IT関連からはもちろん多種多様な業界からも注目される職種であり、データ分析のプロフェッショナルであるデータサイエンティストに必要なデータ分析スキルレベルも解説。
希少なハイクラス人材として高額収入が期待できるデータサイエンティストになるために必要な、データ分析の学問「データサイエンス」習得にぜひお役立てください。
データサイエンティストに求められる3系統のスキル
データ分析を専門とするデータサイエンティストになるためには、以下のような3系統のスキルが求められます。
- 統計学や機械学習などのデータサイエンススキル
- データを加工・実装・運用するエンジニアリングスキル
- マーケットの課題を見極めるビジネススキル
ここでは、上記3系統のスキル概要を解説します。
さらに、データサイエンス協会作成の「スキルチェックリスト」に記された習熟度「見習いレベル」「独り立ちレベル」「棟梁レベル」「業界を代表するレベル」の4段階のうち、「見習いレベル」で必要とされている具体的なスキルも示します。
統計学や機械学習などのデータサイエンススキル
情報を科学的に分析するためには、情報処理・機械学習・統計学など、情報科学に関するスキルが必要です。分析された結果に対して、統計的に適切な解釈ができるかが問われます。
ポイントは”データに惑わされない確固たる基準を持っているかどうか”です。チェックリストによれば、「見習いレベル」で必要な項目は以下のとおりです。
- データ理解・検証スキル
- データ集計・可視化スキル
- 分析設計スキル
- 統計モデリングおよびモデルの評価・調整スキル
出典:データサイエンティスト スキルチェックリスト ver3.01
データを加工・実装・運用するエンジニアリングスキル
そのままでは価値を生まない分析した情報を、意味のある形に整えたり、システムに実装したり、運用までを扱えるスキルが必要です。データの分析や抽出、加工、データ連携、データベース構築などが求められます。
たとえば、スキルセットとしてSQL・R・Pythonなどを身につけるのが望ましいです。SQLでデータを持って来る作業や機械学習エンジニアリング、統計解析作業の他、WebサイトやDBの構造もある程度理解しておく必要があります。
エンジニアレベルになる必要はありませんが、エンジニアの領域で関連する部分は押さえておきたいものです。
チェックリストによれば、「見習いレベル」で必要な項目は以下のとおりです。
- アルゴリズムの開発、実装スキル
- データプレパレーションスキル
- システム開発(設計、コーディングなど)のスキル
出典:データサイエンティスト スキルチェックリスト ver3.01
マーケットの課題を見極めるビジネススキル
マーケットが抱える課題や背景を理解し、データの運用による解決方法に落とし込むためのビジネススキルが必要です。アカデミックな勉強と並行して学んでいきたいところです。
とくにWebマーケティングを含むデジタルマーケティングのスキルは、身につけると実務をこなす上で役に立ちます。マーケティングの知識に加えて、可視化ツールの使い方もマスターするとよいでしょう。
チェックリストによれば、「見習いレベル」で必要な項目は以下のとおりです。
- 分析結果を簡潔に言葉で表現できる論理思考力
- 円滑な情報共有ができるコミュニケーションスキル
- ドキュメンテーションスキル
出典:データサイエンティスト スキルチェックリスト ver3.01
データ分析の勉強の流れ:6つのフェーズ
データサイエンティストを目指すために必要なデータ分析の勉強の流れは、6つのフェーズに分かれます。統計の基礎に始まり、最後にビジネス系かエンジニアリング系を決めるまでの以下の6フェーズです。
- フェーズ1:データ分析の勉強を始める前にすべきこと
- フェーズ2:統計の基礎を勉強する
- フェーズ3:データ分析の基礎を勉強する
- フェーズ4:Pythonを学んで統計の基礎を実装
- フェーズ5:機械学習手法を学んでPythonで実装
- フェーズ6:ビジネス系orエンジニアリング系を決める
データ分析の勉強は、無計画で進めては失敗します。上記6つのフェーズで段階的に学んでいくのが効率的です。
ここでは、フェーズごとに適した具体的な勉強法をご紹介します。
フェーズ1:データ分析の勉強を始める前にすべきこと
データ分析の勉強を始める前に、これから学ぶことを受け入れる下地をつくる必要があります。そのためには、データ分析と統計学の本質をわかりやすく解説した以下の2冊を読みましょう。これらを読み込めば、今後の理解度の向上に役立ちます。
また、勉強に使うPCがロースペックであれば、ストレスが溜まりやすく勉強の足を引っ張ります。もし手持ちのPCのメモリやCPUのレベルが低いなら、たとえばMacBookクラスのものを自分への投資と考えて用意しましょう。
フェーズ2:統計の基礎を勉強する
統計の基礎を勉強するための主な方法は以下の3つです。
- オンライン講座
- セミナー
- 書籍
それぞれを具体的に見ていきましょう。
統計学のオンライン講座を受講する
あなたが社会人であれば、独学者向けのオンライン講座を受講するのがおすすめです。ネット環境とPCかスマホ、タブレットさえあれば手軽に受講できます。
時間や場所を制限されず、実際に手を動かしながら統計学を学べるのでおすすめです。コミュニティがあるものも多く、疑問を解消しやすい体制になっています。
とくにおすすめなのは、Udemyの統計学基礎講座です。
統計学で躓きやすいポイントを14項目に分けて解説しています。
統計検定センターの連携セミナーに参加する
日本統計学会の統計検定センターが大学と連携して、オンラインで参加できる統計学に関するセミナーを積極的に開催しています。講義を担当するのは日本統計学会会員です。講義経験の豊富な講師陣なため、データ分析の基礎をわかりやすく勉強できます。
たとえば、2021年11月現在であれば、京都大学主催で以下のセミナーが開催されています。
- 「データサイエンス講座 データ分析に役立つ統計基礎講座~統計分析ソフトウェアR活用を目指して~」(2022年3月まで視聴可能)
- 「データサイエンス講座 文系のための統計入門講座~統計検定3級を目指して~」(2022年3月まで視聴可能)
参照:連携セミナー|統計検定:Japan Statistical Society Certificate
統計学初学者向けの本で勉強する
統計学に関する初学者向けの本で基礎を学んでおくと、その後専門性が上がってきても系統立てて学べます。多くの良書が出版されていますが、わかりやすいと評価が高いおすすめの2冊を紹介します。
ファストフード店をモチーフとして、登場人物たちと一緒に身近に起こるさまざまな統計的な疑問を解決しながら統計学の基本が理解できる内容です。初学者の最初の1冊にふさわしいでしょう。
出典:統計学がわかる【回帰分析・因子分析編】ファーストブック|Amazon
「統計学がわかる(ファーストブック)」の続編で、アイスクリームショップをモチーフにしています。気温とアイスクリームの関係性や売上と売れ筋要因の関係性などを調べながら、統計学の応用の仕方が無理なく理解できる本です。
フェーズ3:データ分析の基礎を勉強する
初学者がデータ分析・データサイエンスを学ぶ方法については、独学とオンライン講座などで基礎を学び、データ分析コンペなどで実践的にスキルを磨くのが効果的です。まず以下では、基礎の勉強方法を解説します。
データ分析初学者向けの本で勉強する
データ分析初学者向けの本で学ぶと、先の統計学と同様に基礎から系統立てて学べます。ここでご紹介するのは、初学者としてまず読むべき本です。
出典:分析者のためのデータ解釈学入門 データの本質をとらえる技術|Amazon
この本は、データ分析で注意すべきすべてのポイントが示されています。通常のデータ分析初学者に扱われることの少ない内容も含めて、シンプルにわかりやすく説明していることが特徴です。
出典:AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]|Amazon
この本には、データ分析手法の解説ではなく、実際にビジネスとしてデータ分析プロジェクトを実行する際の流れや注意点などのリアルな情報が書かれています。
チャプターごとに対象読者が示されており、あなたが読むべきチャプターがわかりやすいのも特徴です。データエンジニアリングの分野にも話が及んでおり、1冊で多角的な勉強が可能です。
データ分析の目的別の本で勉強
データ分析の目的やレベル別に書籍を選ぶと、効率よく勉強できます。ここでは、目的別に参考になる書籍をご紹介します。
【数理モデル】
出典:データ分析のための数理モデル入門 本質をとらえた分析のために|Amazon
分析を実際に行うと、たくさんの分析手法の中からどれを使ったらよいのかわからなくなることも多いでしょう。そんなときに役立つ1冊です。データ分析で使用される数理モデルが豊富に紹介されています。
一般的なモデルから珍しい手法まで幅広く網羅されているうえに、モデルの選び方や評価方法も詳しく語られています。
【データ分析結果の解釈】
この本では、データ分析の結果を正しく伝えるためのデータを美しく視覚化することの重要性が語られます。有効なグラフや効率的なタイトル、望ましい字体の選び方などの、活きたノウハウが紹介されています。
【データの可視化】
出典:実践Data Scienceシリーズ データ分析のためのデータ可視化入門 (KS情報科学専門書)|Amazon
この本には、Rを用いたデータの可視化に関する実践的な内容が書かれています。他者を説得する目的で、なぜそのデータを選ぶのかがわかりやすく説明されているのが特徴です。
そのため、グラフの出力方法はもちろんのこと、グラフを選択する力も磨かれます。
【データの取得や構造化】
出典:前処理大全[データ分析のためのSQL/R/Python実践テクニック]|Amazon
この本は、RやSQL、そしてPythonという3種類の処理が説明されている他、Not Awesomeなコードとなぜそうなのかの理由まで言及されています。目的とする処理はもちろん、効率的に前処理を行うという一歩踏み込んだ内容まで学べます。
データ分析の手法についてより詳しく知りたい方は、ぜひこちらも読んでみてください。
▼関連記事
データ分析に使えるフレームワーク16選を目的別に徹底紹介!売上分析向けやビジネス向けも!
オンライン講座を活用
現在では、データ分析やデータサイエンスを学ぶためのさまざまなオンライン講座やオンラインスクールがあります。それぞれの体験者のレビューや口コミなどの評判も参考にしながら、自分に合う講座を選んで学ぶのがおすすめです。
たとえば、世界最大級のオンライン学習プラットフォーム「Udemy」の、200以上あるデータサイエンスコースから自分に合いそうなものを選ぶとよいでしょう。
データサイエンスの勉強会に積極的に参加する
データサイエンスの勉強会に積極的に参加することなどを通して、データ分析スキルをブラッシュアップできます。
まずは以下にて勉強会のメリット・デメリットをご確認ください。また、勉強会の開催情報を検索できるサイト情報もあわせてご紹介します。
【勉強会に参加するメリット】
- 最新の情報に触れられる
- アウトプットの機会になる
- ハイクラスのデータサイエンティストに会える
- モチベーションが上がる
【勉強会に参加するデメリット】
- 勉強会は有料の場合がある
- ビジネス目的の勧誘に遭うことがある
【勉強会を検索できるサイト】
データサイエンスの勉強会の情報は、エンジニアの勉強会に特化した情報サイトで探すことができます。どのような勉強会が開催されているのか、月日ごとにチェックすることが可能です。
以下の3サイトは、データサイエンスの勉強会を含むIT関連の勉強会やイベントの代表的な検索サービスサイトです。
- connpass
- Doorkeeper
- THCHPLAY
多くの勉強会はSNSでも情報公開されているので、気になるものがあればSNSで詳細を調べることも可能です。
フェーズ4:Pythonを学んで統計の基礎を実装
Pythonを学ぶことで統計の基礎が実装可能になります。勉強法は以下のとおりです。
Pythonを勉強サイトやオンライン講座で学習
Pythonを学ぶための勉強サイトやオンライン講座があります。無料で提供されているものや、ひと月1,000円程度で学べるコスパがいい勉強サイトや講座も多いため、体験者のレビューや口コミ参考にして選びましょう。
「Progate」は初学者でも理解しやすいように、スライド形式でPythonを学べます。月額1,078円(税込)です。
Progate | プログラミングの入門なら基礎から学べるProgate[プロゲート]
「テックアカデミー」には、Pythonに特化したコースやデータサイエンスコースがあります。現役エンジニアのパーソナルメンターが付くので、不明点があれば積極的に質問でき、疑問を解消しやすい環境を提供してくれます。
前述の「Udemy」にも数多くの講座があります。たとえば、シリコンバレーの現役エンジニアがレクチャーしてくれるものがあります。
30日間返金保証付きで、データ解析やネットワーク、データーベース、並列化や暗号化、インフラ自動化やテスト、非同期処理やキューイングシステムなどの潤沢な内容です。
現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル |Udemy
データ分析コンペにトライ
データ分析の基礎が固まってきたら手を動かして実践し、自ら立てた仮説の検証を繰り返すことによって、データ分析スキルがよく身につきます。とくにデータ分析コンペにトライするのはよい訓練になるでしょう。
比較的やさしいデータ分析コンペである「Nishika」にトライしてみるのがおすすめです。半永久的に無料で参加でき、モチベーションを上げて実践的に鍛えていけるでしょう。
中級に近づけば「SIGNATE」などに挑戦しましょう。レベルが上がれば上級クラスの「Kaggle」などへの挑戦がおすすめです。
「Kaggle」は、世界中の約40万人を超えるデータサイエンティストや機械学習エンジニアが参加するコミュニティです。
開催されるコンペは、企業や政府から提示された課題がテーマとなります。提供されたデータを基に試行錯誤し、最も課題解決につながりそうなモデルを構築したチームには賞金が与えられます。
フェーズ5:機械学習手法を学んでPythonで実装
機械学習の手法を学んでPythonで実装するためには、機械学習の理論と実装をバランスよく学べる動画やオンライン講座、スクール、書籍などで学びましょう。
YouTube動画
最近ではYouTube動画の中にも、勉強になるものがたくさんあります。YouTubeでは「機械学習 Python」と検索すると以下のような動画がヒットします。
【機械学習入門】Pythonで機械学習を実装したい人がはじめに見る動画(教師あり学習・回帰)
オンライン講座
「Udemy」の1,000人以上が受講している講座では、線形代数や微分などの数学の基礎からPythonでの実装までを効率よく短時間で習得できます。30日間返金保証付きです。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 – | Udemy
スクール
スクールで機械学習を学ぶこともできます。
テックアカデミーではAIのコースが人気です。Pythonのライブラリを駆使して、実践的に機械学習の基礎から応用までを学ぶことが可能です。
毎日15〜23時のチャットによるレビューサポートや週2回の1on1のメンタリングがあり、短期間でAI構築に必要なディープラーニングを学べるプログラムとなっています。
書籍
書籍でも機械学習に特化した内容が学べます。たとえば以下の書籍です。
出典:機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)|Amazon
この本では、機械学習で有名なアルゴリズムのいくつかを、学習者がゼロから自分で実装することを目標として編さんされています。ブラックボックスになりやすい機械学習の成り立ちを理解し、応用力と問題解決力を身につけることができます。
また、処理系にはデファクトスタンダードとなっているPythonを使い、機械学習で必要となる数学的知識もわかりやすく解説されています。
初学者だけでなく、いまいち理解できないままデータ分析プロジェクトにアサインされたエンジニアにも役立つ内容です。
フェーズ6:ビジネス系orエンジニアリング系を決める
フェーズ5までくれば、データサイエンティストとして必要なデータ分析の基礎はほぼ出来上がっています。6の段階では、あなた自身の適性とやりたい方向性を見極めましょう。
ビジネス系とエンジニアリング系のどちらにフォーカスするかを決めた方が将来的なビジョンやキャリアを立てやすくなります。
ビジネス系
ビジネス系に進むなら、「マーケティング」「ビジネスフレームワーク」「プロジェクトマネジメント」などを学ぶのがおすすめです。それぞれのおすすめ本をご紹介します。
こちらは文字どおりマーケティングがわかりやすく理解できる本です。最短距離でマーケティング理論を理解し、実践するレベルまで到達する助けとなります。仕事でマーケティングのノウハウを活かしたい人に最適の1冊です。
出典:グロービスMBAキーワード 図解 基本フレームワーク50|Amazon
ビジネスの現場でよく使われる50のフレームワークを、図解も利用して懇切丁寧に解説するガイドブックです。
問題解決や戦略立案、マーケティングやクリティカルシンキングなどのビジネスで実践的に使えます。読破した後も、フレームワークの辞書的な位置付けで手元に置いておきたい1冊です。
出典:プロジェクトマネジメント標準 PMBOK入門|Amazon
プロジェクトマネジメントを理解するために必要な知識体系である「PMBOK」について、要点をしぼって解説している書籍です。
そもそもプロジェクトとは何かを解説した上で、PMBOKがどのように現場で活かされるのかを具体的なシーンに置き換えて紹介されているため、理解が進みやすい内容となっています。
エンジニアリング系
エンジニアリング系に進む場合は、ディープラーニングなどの先端技術の知見をオンライン講座や書籍で学びましょう。
Udemyで「ディープラーニング」で検索すると多くの講座がチェックできます。たとえば、以下のような講座があります。
- ディープラーニング : Pythonでゼロから構築し学ぶ人工知能(AI)と深層学習の原理 | Udemy
- 【PyTorch+Colab】PyTorchで実装するディープラーニング -CNN、RNN、人工知能Webアプリの構築-
数ある講座の中から、あなたの学びたい内容を選んで受講しましょう。
データ分析関連の資格取得で人材価値を高める
データ分析のスペシャリストやデータサイエンティストになるために、とくに必要な資格はありません。しかし、ここでご紹介する資格は知見の客観的な証明になり、持っていると人材価値が上がります。
また、資格取得のための勉強をとおしてデータサイエンティストにとって役立つ知識が学べるため、以下のような資格を取得するのがおすすめです。
- 基本情報技術者試験
- 応用情報技術者試験
- データベーススペシャリスト試験
- 統計検定
- ORACLE MASTER
- オープンソースデータベース技術者認定資格
- Python 3 エンジニア認定データ分析試験
- G検定/E資格
まとめ
データ分析の勉強方法は、独学や講座の受講、勉強会への参加、データ分析コンペへの参加などが挙げられます。自分に合った学習ビジョンを描いてトライしましょう。
データ分析を習得しデータサイエンティストになれば、企業の経営課題をデータサイエンスの知見からコンサルティングするキャリアアップへの道が拓けます。
弊社Liberty Nation(リバティネイション)では、データ分析のスキルを持ったデータサイエンティストの方に、その技術を活かせるコンサルティング案件を提供し、手厚く支援しています。ぜひ以下のバナーよりご登録ください。