業務・業界・技術
2021.12.9
データ分析に使えるフレームワーク16選を目的別に徹底紹介!売上分析向けやビジネス向けも!
INDEX
データ分析の精度を上げるためや業務の効率化のために「データ分析に使えるフレームワークの理解を深めたい。」「目的に最適なデータ分析フレームワークを身に着けたい。」「論理的思考力(ロジカルシンキング)を高めるためデータ分析力を高めたい。」と考えたことはありませんか?
本稿を読めば、上記のようなデータ分析のフレームワークについての悩みを解消するとともに、確かな情報を正しく理解・把握できるようにすることで、分析の手間を短縮したり、先を予測し適切な戦略を練ることが可能となります。
データ分析の目的に沿ったフレームワークを詳しくご紹介していますので、ぜひ最後までご覧ください。
Pythonでのデータ分析にも役立つフレームワーク16選の目的別一覧表!
豊富なフレームワークをまずは目的別にみていきましょう。5つの目的別フレームワーク全16種類を、まずはそれぞれの要点について見ていきましょう。
「要約」を目的としたフレームワーク | |
---|---|
因子分析 | 変数に影響的な共通因子を見つけ出します。カテゴリやブランドのイメージを把握する際によく活用されます。 |
主成分分析 | 少数変数に組み合わせてデータを見やすくし、複雑なものを簡潔に、かつ分かりやすくまとめるために用います。 |
コレスポンデンス分析 | 年代別の好みや満足度などの質的なデータを出すことが可能になり、クロス集計表として表します。 |
「分類」を目的としたフレームワーク | |
---|---|
潜在クラス分析 | 顧客や商品をグルーピングする際に使用します。分析の柔軟性が高いのが大きな特徴です。 |
クラスター分析 | 顧客分類や製品分類などで広く用いられています。潜在クラス分析と似ていますが、それぞれのアプローチが異なります。 |
「予測」を目的としたフレームワーク | |
---|---|
決定木分析 | その名の通り、木のようにデータを分類していくフレームワークです。分類だけではなく、予測としても使用することができます。 |
ランダムフォレスト | 機械学習の手法の1つです。上記の決定木を複数用意し分析を行い、その中の多数決で結果を得ます。 |
線形回帰分析 | 変数の変動を別の変数を用いた説明や予測などによく利用され、単回帰分析、重回帰分析の2つに分けられます。 |
「売上」を目的としたフレームワーク | |
---|---|
因数分解 | 初心者でも手軽に活用できます。複数の要素へ分け、細かな単位で検証を行う事で本質を見出し、今何が必要なのかを正しく判断することができます。 |
アソシエーション分析 | 多々ある項目の関連性に着目し、単一では分からない情報を知るために優れたフレームワークです。複数要素を紐づけし、相乗効果を割り出すことができます。 |
ABC分析 | 商品をグループ分けし、柱となるメインの商品や今後の生産を考え直すべき商品などに分類し販促戦略を組みやすくします。 |
RFM分析 | 直近購入日のRecency、購入頻度のFrequency、購入金額のMonetaryを指標とし、顧客をグループ分けすることで適切なマーケティングをすることが可能です。 |
デシル分析 | 分類することを軸にしたフレームワークの中で特にシンプルな手法です。顧客を10のグループに分類し、購入金額順に顧客を並べ替え10等分します。 |
「ビジネス」を目的としたフレームワーク | |
---|---|
バランススコアカード | 顧客・財務・学習・業務プロセス・成長の4つの視点からの評価をするフレームワークになります。ビジョンと戦略を同時に引き出す非常に効率の良いフレームワークです。 |
バリューチェーン分析 | 企業の活動を主活動と支援活動に分け、個別活動ごとに分析する事で、高い付加価値はどこで生み出されるのか、どの工程に問題があるかなど、自社の強みと弱みを把握することが可能になります。 |
BCGマトリクス | 市場成長率、相対的市場シェアの2つを軸とし、事業単位を4つのタイプに分類していきます。企業の全体的な競争力を高めることができるようになります。 |
【要約編】データ分析に使えるフレームワーク3選
複雑なデータはそれだけ見ても理解することは難しく、把握するのに時間がかかってしまいます。しかし、シンプル化する事でデータの全体像が把握しやすくなり、データの理解度も格段に上げることができます。
因子分析
主成分分析
コレスポンデンス分析
上記3つのフレームワークは、複雑なデータをまとめて理解しやすくするために非常に効果的です。それぞれの活用について、詳しく見ていきましょう。
因子分析
特定のある結果をもたらす元になった要素を因子と言い、いくつもある変数において共通する因子を探り出すためのテンプレートです。この隠れた要素を「共通因子」と言います。
因子を見つける事、また、多くの観測変数を分析する事で、影響を与えている共通因子を見つけだすことになります。一見しただけではそこに隠れている潜在的な因子を見つけ出すことはできませんが、因子分析を行う事で詳細を知ることができます。
アンケート調査と非常に相性が良く、カテゴリやブランドイメージなど、消費者の傾向を把握するために利用されます。
主成分分析
主成分分析とは、複数ある変数をまとめることで数を減らし、データの見通しを良くするためのテンプレートで、「次元の縮約」という呼ばれ方もあります。
分析を行い、集約した合成変数を主成分と言います。この主成分分析は、変数が少ない場合などにはあまり効力を発揮することはありません。複数ある変数をまとめるものとなるので、データが多い時に活用することで効果を発揮します。
しかし、変数をまとめるとそのデータの中の一部情報がなかったことになってしまうこともありますので、注意が必要です。
コレスポンデンス分析
コレスポンデンス分析とは、クロス集計表の結果を散布図にして見やすくするテンプレートです。クロス集計表上でまとめるため、調査データの項目が多すぎると内容に対する理解度が下がり把握しにくくなってしまう場合があります。
メディアなどで多く用いられており、複数ある変数の関係を分かりやすく表現する際によく活用されています。主成分分析と似ている部分がありますが、扱うデータが量なのか質なのかという違いがあります。
アンケートとの相性は悪くありませんが、この散布図から回答者の数などの量や具体的な数字を知ることはできません。
【分類編】データ分析に使えるフレームワーク2選
データを複数のグループに分類するためのフレームワークを使用する事で、効率的な分析が行えるようになります。
- クラスター分析
- 潜在クラス分析
上記2つのフレームワークが最も代表的と言えるでしょう。このフレームワークは、主にセグメンテーションをしたいときに活用できるものとなります。1つずつ詳しく見ていきましょう。
クラスター分析
クラスター分析とは、量のあるデータから似た者同士でのクラスター(グループ)を作り、分類していくテンプレートです。顧客分類や製粉分類などで最もよく利用されています。分類結果は統計的な意味合いはありません。
クラスター分析は階層的クラスタリングと非階層的クラスタリングの2つに分けられます。
階層的クラスタリング | 分岐したクラスターが形成されていきます。階層が深ければ深いほど多くの分類が行われ、似ているものは近く、似ていないものは遠くにいくような形になります。 |
---|
非階層的クラスタリング | 指定した数のクラスターに分類することができます。3つなら3つ、4つなら4つと決められた数の分類になるため、階層的クラスタリングのような分岐などはありません。「k-means法」と呼ばれることもあります。 |
---|
潜在クラス分析
潜在クラス分析とは、質的データや順序データなどが混在したデータであっても、統計的クラスに分けられるテンプレートです。潜在クラス分析では、必ずどこかしらのクラスに属するということではありません。
さまざまなデータが複数ある中でも、隠れた共通点を見つけだしクラス分けすることが可能で、クラスター分析とは違って統計的に分類がされます。
しかし、ここでクラス数をむやみに増やしすぎてしまうと、識別ができない対象が出てしまうということもありますので注意してください。
【予測編】データ分析でも使えるフレームワーク3選
フレームワークを使って将来的な結果の予測をすることも可能です。ここで、代表的な予測可能なフレームワークをご紹介します。
- 決定木分析
- ランダムフォレスト
- 線形回帰分析
データ予測に役立つフレームワークは上記の3つになります。予測を行う事で今後の戦略などに活かし効率的な計画を立てることが可能です。
決定木分析
決定木分析とは、ある原因から複数の条件分岐を繰り返すことで、何と織物予測ができるテンプレートです。「もしも〇〇だったらこの結果になるのではないか」といった事を繰り返すことで予測していきます。
形は木のようになっており、可読性が高いのが特徴的です。
たとえば、商品の持つ要素のなかで、顧客の高い満足度につながっているのがどの要素・特徴なのかの判別や満足度の高い顧客の属性を分類するなど、判別や分類のためにあらゆるデータを扱うことができ、予測結果の説明も非常にしやすくなっています。
外れ値の影響はあまり受けませんが、予測精度はさほど高くないため過学習の発生率は高くなってしまいます。リスクマネジメントで取り入れられることが多く、別名回帰木や分類木といった名称もあります。
ランダムフォレスト
ランダムフォレストとは、機械学習の1つで、複数の決定木を集めて分析する事で、決定木よりも高い精度の予測を可能にするテンプレートです。簡単に言えば、決定木を集めて合体させた手法と言えます。
決定木単体ではそれほど対方法とは言えませんが、ランダムフォレストで多く集めて行う事でより強い効果を発揮するようになります。
データから予測をするのであればランダムフォレストが適しています。なぜなら、決定木の弱点である過学習の部分を克服しており、特徴量の重要度の産出も可能だからです。
さらに、データ変数が多い場合であっても、Pythonなどで高速な学習や識別が可能となります。
線形回帰分析
線形回帰分析とは、ある変数xが変数yに対して、どれほどの影響があるのかを分析し予測するテンプレートです。
家賃、来客数、価格変動などの予測を行う場面で広く活用されています。予測する変数xの変化により目的変数yも変化していくため、それぞれ従属変数、独立変数と呼ばれることもあります。
線形回帰分析は「単回帰分析」「重回帰分析」があり、実務では単回帰分析の方が用いられやすくなっています。
単回帰分析 | 回帰分析の中で最も有名どころと言えばこの単回帰分析です。説明変数が1つとなり直線的に表すことができます。 |
---|---|
重回帰分析 | 説明変数が2つ以上存在するものが重回帰分析となり、単回帰分析のように直線的ではありません。 |
【売上編】データ分析に使えるフレームワーク5選
売上データの分析は、今後の戦略を組み立てるためにも非常に重要な項目となります。
以下の5つが、売上のデータ分析に役立つフレームワークです。
- 因数分解
- アソシエーション分析
- ABC分析
- RFM分析
- デシル分析
ビジネスにおいて売上の分析は必須ですが、求めている分析結果を得る方法がわからない方も多いでしょう。フレームワークをうまく活用し、効率的な分析を行っていきましょう。
因数分解
データ分析における因数分解とは、大きい事象をひとつずつの要素に分けることで、売上減少などの要因を特定しやすくするフレームワークです。この因数分解は、データ分析に慣れていない初心者であっても扱いやすく、最も広く活用されているフレームワークとなります。
要素を細かくしていく事で、解決すべき問題の本質的な部分が見つかりやすくなるため、効果的改善を行うことが可能です。
課題をいち早く見つけ出し、素早い対処を行うことができれば売上の改善に繋がります。因数分解を行い要素を細かく分け、それぞれの原因や課題を素早く見つけられるようにしてください。
アソシエーション分析
アソシエーション分析とは、どの商品が同時に売れやすいのかなど、売上に関する2つの関連性を導き出すフレームワークです。売上に関わるものにはさまざまな関連性があり、1つだけで見ていては分からないような貴重な情報を入手する事も可能となります。
アソシエーション分析は、小さな個人の洋菓子店、大型スーパーなどといった規模に関係なく活用することができます。複数要素の関連性を明確化する事で、その相乗効果を割り出すことが可能となります。
一見何の関連もなさそうなものであっても、実は影響しあっているということも少なくありません。こういった目には見えないような関連性を導き出すために非常に有効なのがこのアソシエーション分析です。
ABC分析
ABC分析とは、どの商品の売れ行きが良く、どの商品の売れ行きが悪いのかを特定するのに役立つテンプレートです。
全体の売り上げの中で最も割合の高いものをAグループとして、商品の柱と考えます。その次に、中間位置のものはBグループ、売上割合の低いものをCグループに分類し、今後の方針などを決めていきます。
たとえば、Cグループの商品を生産停止し、Aグループの強化をしていくといった計画を立てたり、Cグループの売上を伸ばすためにはどうすべきか、何が必要なのかを調査したりなど、商品全体の構図を作り上げていくことができます。
在庫管理に対するヒントも見えてくるため、発注数の調整などもしやすくなります。
RFM分析
RFM分析とは顧客分析のひとつで、以下の3つの指標により顧客をグルーピングすることで、企業にとって優先すべき顧客のグループを把握できるテンプレートです。
- Recency(直近の購入日)
- Frequency(購入頻度)
- Monetary(購入金額)
それぞれの指標にスコアを付け、顧客を分類していきます。グループごとに最適な戦略を計画しマーケティングを行う事で、全体的な売り上げアップに繋がります。ランクの高いグループであれば、DMなどの施策を行う事が多いでしょう。
また、ランクが低いグループの場合、興味や関心が他企業へ向いていることも考えられます。そういった場合には、クーポンや特別な割引企画などで顧客がひき戻せるような施策が効果的です。
デシル分析
デシル分析とは、購入金額をもとに顧客を10段階にランク付けすることで、高額購買客を特定できるテンプレートです。
デシルという言葉には10等分という意味があります。購入金額順に顧客を並べた表を作成し、それを10等分します。そこで分けられたグループごとに適した施策を計画することができます。
デシル分析は、分析にまだ慣れていないという方にとっても扱いやすいのが特徴です。このデシル分析はRFM分析をより簡潔にしたシンプル版のようなものになりますので、より深い分析はできません。
【ビジネス編】データ分析で知っておくべきフレームワーク3選
ビジネスはさまざまな視点からの分析が非常に大切です。
- バランススコアカード
- BCGマトリクス
- バリューチェーン分析
上記3つが、ビジネス上でとくに活用できるフレームワークになります。
それぞれをよく理解し適切に活用することで、効率良くデータ分析を行うことができます。スムーズな業務遂行のために、以下にて詳細をご覧ください。
バランススコアカード
バランススコアカードとは、以下の4項目より企業目標を立て、どう実行できているかを評価できるフレームワークです。
財務 | 売上をアップさせる方法やコストを最小限まで抑える方法など |
---|---|
顧客価値 | 顧客満足度を上げる方法、新規顧客開拓の方法や訴求方法など |
業務プロセス | 自社内の各種目標を達成するための構築や改善方法 |
学習と成長 | 目標とするビジョン達成のための人材育成方法 |
この4つの視点から、目標達成するための具体的なアクションが把握しやすくなり、現状の達成度がどの程度なのかも分かりやすくなります。
データ分析の仕事の場合、データ指標システムの確率や最適化を求められるというケースが少なくありません。そういった際にはこのバランススコアカードを用いることで、それぞれの指標の把握、整理がしやすくなります。
BCGマトリクス
BCGマトリックスとは、長期的な企業戦略を計画する際によく利用され、事業や製品を以下の4つタイプに分類していくフレームワークです。
花形 | 市場シェア率、市場成長率が共に高い |
---|---|
金のなる木 | 市場シェア率が高い。しかし市場成長率は低い |
問題児 | 市場シェア率が低く、市場成長率は高い |
負け犬 | 市場シェア率、市場成長率がともに低い |
BCGマトリクスでは、市場シェア率・市場成長率の2つの軸によって、4つのタイプに分けることができます。
この結果を基にすることで、各事業への経営資源をどのように配分すべきか、予算の振り分けはどうすべきかなどが見えてきます。
この4象限マトリックスは、データ分析にとって非常に重要な考え方のひとつですので、しっかりと把握しておくようにしてください。
バリューチェーン分析
バリューチェーン分析とは、製品の製造から顧客に製品が届くまでの一連の活動を捉えるもので、活動を細分化することで企業の強みを把握できるテンプレートです。
自社の商品、またはサービスに関する大きな強みや、コストが生じるのはどこの工程なのかといったことを知ることができます。
強みだけではなく、その商品、サービスに関する弱みも鮮明になるので、そこを補うための最適な戦略を組み立てることが可能です。
競合企業を分析すれば、戦略の予想が可能となり、自社との更なる差別化を図ることもできます。企業構造、製造過程などの全体的な部分をしっかりと把握できるため、課題を見つけるだけではなく、その解決の糸口も見つけやすくなるのが特徴です。
データ分析のフレームワークは詳しく解説している書籍などを1冊持っておくと、必要な手法を選択する際に役立ちます。データ分析のフレームワークの書籍については以下の記事にて解説しています。ぜひこちらも読んでみてください。
▼関連記事
データ分析の勉強方法は?データサイエンティストに求められるスキルも紹介
データ分析のフレームワークを選ぶ際の2つの注意点
ここまでは、要件に適したデータ分析のフレームワークをご紹介しました。次に、フレームワークをどう選べば良いのか、何処に注意すべきなのかをお伝えします。
フレームワークを正しく選ぶことができなければ、業務遂行、戦略立案に支障が出てしまいます。後々に方向転換しなければいけなくなったり、コストが大幅にかかってしまった、時間や手間が無駄になったという事態に陥る可能性があります。
こうしたことを未然に防ぐために、まずはフレームワーク選びを誤らないようにすることが大切です。
目的が曖昧な状況でフレームワーク選びをしない
データ分析で最も重要になるのが目的です。無駄な手間や労力をかけてしまうといった事を回避するためにも、分析を行う前になぜデータ分析を行うのか、何のためのデータ分析なのかということを明確にしておきましょう。
目的がはっきりしていても、最初から高度なデータ分析を行うのではなく、最初は簡易的なものからはじめていき、徐々にレベルをあげていくことをおすすめします。
目的に沿った最適なフレームワークを正しく選択する事で、効率的なデータ分析を行う事が可能となります。
テンプレートにこだわりすぎない
データ分析において、テンプレートに従い分析を行うことはとても大切です。
しかし、新しく覚えたデータ分析の方法に固執しすぎると、どうしても視野が狭くなり目的達成をするためのヒントを見落としがちになるため、こだわりすぎないことも重要になります。
ただし、データ分析におけるテンプレートを理解していないと、目的に合ったものを選択できなくなるため、まったくこだわらないでフレームワークを選択してしまっては問題が生じてしまいます。
まずはそれぞれのフレームワークを把握し理解を深め、正確な分析が行えるように徹底したうえで、あらゆる想定のもと分析を行いましょう。
まとめ
データ分析のフレームワークは、目的に沿った最適なものを選ぶことが大切です。
要約のためのフレームワーク | ・子分析 ・主成分分析 ・コレスポンデンス分析 |
---|---|
分類のためのフレームワーク | ・クラスター分析 ・潜在クラス分析 |
予測のためのフレームワーク | ・決定木分析 ・ランダムフォレスト ・線形回帰分析 |
売上のためのフレームワーク | ・因数分解 ・アソシエーション分析 ・ABC分析 ・RFM分析 ・デシル分析 |
ビジネスのためのフレームワーク | ・バランススコアカード ・BCGマトリクス ・バリューチェーン分析 |
一言でデータ分析のフレームワークと言っても、この記事で紹介したものがすべてという訳ではなく、他にも種類が豊富にあります。ただし、上記のように、各目的に沿った正しいフレームワークを選ぶことが重要です。
しかしその際、データ分析の手段にこだわりすぎて、本来の目的を見失わないように注意してください。
弊社Liberty Nation(リバティネイション)では、高度なデータ分析に関する案件を多数保有しています。自身のデータ分析スキルを活用しつつフリーランスで活躍したい方は、以下バナーより登録、ぜひ案件獲得のためにご活用ください。