この記事でわかること
- データ分析とデータ集計の違い
- データ分析を活用して成長した企業の事例
- データ分析が必要な理由
- データ分析をする前の準備・手順
- データ分析をする際に気を付けること
執筆者 代表取締役社長 / CEO 杉山元紀
今回はタイトルの通り、初心者に向けたデータ分析の基本を紹介したいと思います。
昨今、データドリブンやらデータアナリティクスなどなど、データというキーワードを皮切りに様々な言葉が様々な場で飛び交い、一時のバズワードから、ビジネスにおけるスタンダードとなりました。もはや、ビジネスシーンにおいてデータ分析は、企業の成功に欠かせない要素のひとつとして、理系文系問わず、その知識や技術が求められるようにもなってきました。
とはいえ、なぜデータ分析が必要なのか?そもそもデータ分析って何なのか、その本質を掴み損ねている人も多いのではないでしょうか。
例えば、上司や先輩から「そのデータとりあえず分析しておいて」と言われたものの、どこから手を付ければいいのか、とりあえず手を動かしてみたけれど、本当にこれでいいのだろうか、何かアレルギー反応が出てきた、年度の初めそんな叫びが各所から聞こえてくるような気がします。 数年前、まさしく私もその一人でした。
でも、安心してください。今回は、そんな悩みを持つ同志に向けて、手を動かす前に知っておきたいデータ分析のキホンのキ、心構えを紹介したいと思います。データ分析と聞いて、身構えてしまうこともあるかもしれません。けれども、一呼吸おいて本記事を読んでみてください。超初心者だった筆者が、超初心者に向けてなるべくわかりやすく説明したいと思います。
※今回の記事は、筆者の独断と偏見により、いつもとテイストを変え、より読者に寄り添ったやさしい口調(当社比)でお届けしたいと思います。
目次
1.データ分析とデータ集計の違いとは?
ビジネスにおけるデータ分析の説明をする前に、初心者が混合しがちな「データ分析」と「データ集計」の違いを説明します。
「データ分析とは何か?」を問われるとみなさんはどんな回答をしますか?
おそらく「データを集めて分けること」「数字で表現すること」などの答えが返ってくるかもしれません。もちろんそれらもデータ分析の大切な要素の一つとなり得ます。
上記の二つ「データ集めて分けること」「数字で表現すること」は、分析というよりも「集計」と表現するほうが適切でしょう。ここで、改めて、「分析」と「集計」の違いをおさらいしましょう。
データ分析
データ分析とは、集めたデータを詳しく調べ、データに含まれる傾向やパターンを見つけるための技術的なアプローチです。データの複雑さを理解し、傾向やパターンを発見するために、統計的、数学的、機械学習などのテクニックを使用します。データ分析は、集計によって集められた整理されたデータを眺めることに終わらず、
そこから何かしらの知見・洞察を得るために用いられます。
データ分析の技術として、データマイニング、機械学習、予測分析、クラスタリング、相関分析、異常検知などが挙げられます。
したがって、データ集計は、データを整理し、概要を把握するために使用される方法であり、データ分析は、データから知見を得るためにより詳細な分析が必要な場合に使用されます。
データ集計
データを集め、整理し、要約するプロセスです。例えば、基本統計量や分布を得ることで、企業は指標としている現状を正確に把握することができます。
データ集計の手法の例には、集計、平均、中央値、標準偏差、分位数などがあります。データ集計は、データを整理して意味を与え、現状を客観的に捉えるための「現状把握」には役立ちますが、成果を出すための行動にはつながりにくい側面もあります。
実際に、作業をしてみるデータ分析をしているつもりが、データを集計することに満足していませんか?しっかり、集計したデータを分析し考察することで、ビジネスに役立てましょう。
2.ビジネスにおけるデータ分析とは?
ビジネスにおけるデータ分析とは、企業が保有するデータを比較し、意思決定や業務改善に役立てることを指します。例えば、販売データを分析することで、顧客の嗜好や需要傾向を把握し、新商品の企画や販売戦略の改善に活かすことができます。
実際にデータ分析を活用し、ビジネス成長を遂げた企業の事例を紹介します。
ZARA(ファストファッションブランド)
顧客の購買データ分析、フィードバックのリアルタイムで分析で最新トレンドを把握
ZARAでは顧客の購買データやフィードバックをリアルタイムで分析し、ファストファッションのトレンドを把握、商品開発や生産計画を最適化しています。
短期間で商品を開発し、店舗に展示することで、常に最新のトレンドに合わせた商品を提供しています。このため、ZARAではリアルタイムのデータ分析が欠かせません。ZARAは、店舗やオンラインストアでの販売データ、顧客のフィードバック、SNS上でのトレンドなどをリアルタイムで収集し、それらのデータを分析して、最新のトレンドを把握します。そして、そのトレンドに合わせた商品を開発し、生産計画を最適化して、最短で商品を店舗に出荷します。
また、ZARAは店舗の売上データや在庫情報も同様にリアルタイムで分析することで、効率的な店舗運営を実現しています。売上データをもとに需要が高い商品を優先的に補充したり、在庫情報をもとに商品の配置を最適化することで、店舗の売上向上に繋げています。
このように、ZARAはデータ分析を活用することで、常に最新のトレンドに合わせた商品を提供し、店舗運営を効率化しています。これらの取り組みにより、ZARAは世界中で人気のあるブランドとなり、高い売上を誇っているのです。
3.どうしてデータ分析が必要なの?
では、ビジネスにおいてデータ分析はどうしてここまで重要視されるようになったのでしょうか。理由は多岐に渡りますが、以下に代表的な理由をいくつか挙げてみます。
① 意思決定の根拠となる情報提供
データ分析によって、顧客の行動パターンや嗜好、市場動向、競合情報などのデータを収集・分析することができます。自身のビジネスを取り巻く環境の理解を深めること、また正確な情報を基にメリットやデメリット整理するなど、重要な意思決定を行う際にとても重要な役割を果たします。
② コスト削減や利益の最大化
データ分析では、これまで見えてこなかった労力やパフォーマンス等をデータとして集計し、定量的に可視化し比較検討することができます。そこで出てきた結果を活かして、プロセスの改善やマーケティング戦略の最適化など、企業のコスト削減や利益最大化につながる施策を立案などに役立てることもできるでしょう。
③ リスク管理の強化
企業は、リスクを最小限に抑えることが求められます。データ分析によって、財務、法務、品質管理などの分野でリスクを特定し、早期に対処することができます。
④ サービスの改善
データ分析によって、顧客のニーズや嗜好を正確に把握することができます。それに基づいたサービス改善や新しい商品の開発に繋がります。
⑤ 効率の向上
データ分析は、プロセスやシステムの改善を支援することができます。たとえば、製造業においては、製品の生産に関するデータを分析することで、生産性を向上させることができます。
以上の理由から、データ分析は、情報を活用し、ビジネスで目標を達成するため、または課題を解決するために重要なプロセスであることがわかりました。ビジネスの場面においては、意思決定や提案をする際に相手を納得させるために必要な材料として重要視されることもあるでしょう。
4.データ分析をする手順は?
では、早速データ分析をしてみましょう。と言いたいところですが、落ち着きましょう。闇雲にツールや数字に触って手を動かすまえに、データ分析をする前の準備・手順を確認しましょう。
① 目的を明確にする
データ分析を行う前に、何を解決したいのか、何を改善したいのかという目的を明確にすることが重要です。目的が明確でない場合、データ分析を行っても無駄になってしまいます。何を見極め、何を検証するのかをしっかり定めましょう。
目的を明確化するための具体的なステップは2つ。
- 現状課題の把握:課題の洗い出し及び優先順位の付与
- 分析ゴールの明確化:ターゲットとする課題・達成目標の明確化
集めるデータや見るべき軸など、そもそもの活動の方向性も異なり
目的があやふやなままだと、集めるデータや見るべき軸など、そもそもの活動の方向性も異なるだけでなく、本来解決したかったことを達成することや仮説の検証も難しくなるでしょう。
② 課題に対する仮説を設定
データを分析する前に、データに基づいて予測を立てましょう。具体的には、データ分析を行う前に、分析の目的を明確にしました。その後は、分析後に期待される結果を予測します。そして、その予測に基づいて、分析に必要なデータを収集したり、分析手法を選定したりすることができます。仮説を設定することにより、分析に必要なデータを収集しやすくなります。また、仮説に基づいて必要な分析手法を選択することができるため、分析の効率性が向上します。
③ 適切なデータを収集する
仮説を設定したら、適切なデータを収集する必要があります。過去のデータ、競合他社のデータ、市場のデータなど、目的に応じたデータを収集し、解析に使用します。そのデータが果たして正しいのかしっかりと見極める必要があります。
④ データの品質を確認する
収集したデータの品質が低い場合、正確な分析結果を得ることができません。データの欠損やエラー、外れ値などの問題を確認し、必要に応じてクレンジングを行い、品質の高いデータを対象にします。
⑤ 分析手法を選定する
データ分析には、様々な手法があります。今回は主に代表的な3つの手法を簡単に紹介します。目的に沿って、適した分析方法を選択しましょう。
a. 回帰分析
2つ以上の変数の関係を調べるための統計的手法です。一方の変数を独立変数、もう一方の変数を従属変数として扱います。回帰分析では、独立変数と従属変数の間にどのような関係があるかを調べ、その関係を数式的に表すことができます。
例えば、住宅価格を予測するために、住宅の広さや立地などの要因を独立変数として扱い、住宅価格を従属変数として扱うことができます。この場合、回帰分析を用いて独立変数と従属変数の関係を調べ、住宅価格を予測するための数式を導き出すことができます。
b. 分類分析
与えられたデータをカテゴリ別に分類するための統計的手法です。例えば、ある商品が男性向けか女性向けかを分類する場合や、あるメールがスパムか否かを分類する場合などに利用されます。
データを学習させるための分類すべきモデルを用意します。これらのモデルは、学習データに基づいて特徴量とラベル(分類対象となるカテゴリ)の関係を学習し、未知のデータに対して正確な予測を行うことができます。
構築したモデルの性能を評価します。モデルの性能を評価するためには、訓練データとテストデータに分け、テストデータに対して予測を行い、正解率や適合率、再現率、F値などの評価指標を用いて性能を測定します。
モデルの性能を向上させるために、モデルの構造や特徴量の選択などを変更し、再度評価を行うことも重要です。性能が改善されなくなるまで、改良を繰り返しましょう。
そして、構築したモデルを使って未知のデータに対して予測を行います。分類された結果を元に、ビジネス上の意思決定などに活用することができます。分類分析は、様々な分野で活用されることがあり、機械学習や人工知能の分野でも重要な手法の一つとなっています。
c. クラスタリング分析
似た属性を持つデータをグループ分けするための手法です。クラスタリング分析を用いることで、大量のデータを可視化し、パターンを発見することができます。例えば、顧客データをクラスタリング分析にかけることで、同じ属性を持つ顧客をグループ分けし、それぞれのグループに対して最適なマーケティング戦略を立てることができます。クラスタリング対象となるデータを収集します。例えば、商品の購入履歴、顧客の属性などがあります。
各データ間の距離を計算します。距離は、データの属性の差異を基に計算されます。選択した距離計算方法に基づいて、クラスタリング手法を選択します。代表的な手法には、k-means法、階層型クラスタリング、DBSCANなどがあります。(詳しくは別記事にて紹介します。)
選択したクラスタリング手法に基づいて、クラスタリングを実行します。データをグループ分けし、各グループにラベルを付与します。クラスタリング結果の評価を行います。
クラスタリング結果を解釈し、各クラスタの特徴を把握します。クラスタリング結果を元に、ビジネス上の意思決定などに活用することができます。
今回紹介した分析手法はあくまで、代表的なものの一部です。データ分析の手法を挙げると、アソシエーション・バスケット分析、クロス集計・線形回帰分析、決定木分析、ロジスティック回帰分析、因子分析、ABC分析・・・などなど、語りだすとキリがありません。また、これらの手法を用いて分析結果を導いたとしても、データの読み解き方がわからなければ意味がありません。結果を解釈する際には注意が必要です。目的やビジネスシーンに合わせて適切な分析方法を選びましょう。
⑥ 結果の評価・現場への適用
データ分析の結果を実際のビジネスに活用しましょう。例えば、ビジネスの意思決定をする際の判断の材料にすることもできます。、。分析結果から派生する課題や改善案を抽出し、現場に適用することで、企業の成長に繋げます。最初の章に戻りますが、データ集め、眺めて満足するに終わることなく、そこから何か得ることがゴールとなります。
以上のようにデータ分析をするには、事前の準備がとても大切です。目的の確認や手法の設定など、事前の設計を入念に行いましょう。
5.データ分析をする前に知っておきたいキーワードは?
では、実際にデータ分析をするとなると、どんなスキルが必要となるのでしょうか。ツールを使いこなすためのスキルはもちろん、プログラミングや学問的知識まで多岐にわたります。
今回はそれらの具体的なやり方ではなく、これからデータ分析をするにあたって、知っておくとよいスキルや作業の名称や概要を簡単に説明します。以下のキーワードを知っていて損はないので、目を通しておきましょう。
データベースの活用
データベースとは、データを蓄積するための仕組みであり、複数の関連するデータを一元管理することができます。具体的には、顧客情報や在庫情報、取引情報などの業務データを蓄積し、必要に応じて検索や更新、集計などの処理を行うことができます。
データの前処理
データクリーニング。データ整形とも呼ばれます。データを分析する前の準備として、欠損地の処理や外れ値の除去、重複データの削除、データのスケーリング、正規化なども含まれます。 データの前処理を行うことで、データの質を向上し、分析結果の信頼性を高めることができます。 逆に欠損値、外れ値が存在する場合結果に大きな影響を与える可能性もあります。データの前処理はデータ分析にとって必要不可欠なステップです。
データ可視化
データを視覚化することで、洞察を得ることができます。ただ数字が並んでいるよりもグラフや図表にすることで膨大なデータを簡単に表現し、傾向やパターンを理解することに役立てることができます。 例えば、折れ線グラフでは変化を、円グラフでは構成などを表現できます。他にも地図やヒストグラム等様々な表現方法があります。目的によって使い分けましょう。
データを可視化するためのツールも多く存在します。代表的なものではTableau、Excel、Pythonなどです。
統計学
統計学とは、数値データを収集し、分析し、解釈することによって、現象や問題を理解するための学問です。統計学は、大学などでも講義が行われ自然科学や社会科学など、あらゆる分野で広く応用されています。
統計学の主な目的は、データからパターンや傾向を見出し、これらのデータをもとに予測や意思決定を行うことです。ビジネスの場においては、平均、分散、標準偏差、回帰、分布などの統計学の知識が活用されることが多いです。
機械学習
機械学習とは、コンピュータに人工知能を実現させるための手法の一つで、データから自動的にパターンや規則性を学習し、未知のデータに対して予測や判断を行うことができる技術です。大量のデータから特徴を抽出し、その特徴をもとに様々な問題を解決することができます。例えば、画像や音声、自然言語などのデータを分類したり、音声認識や自動翻訳などのタスクを実現することができます。一方で機械学習にも限界があります。機械学習で得られた結果がすべて正しいとは限りません。すべてを信頼せずに人間の頭で洞察を得ることの重要性も忘れないでください。
ビジネス理解
ビジネスの問題を理解し、データ分析の成果をビジネスに活用することが重要です。ビジネス知識を学び、ビジネスの視点でデータを分析する方法を学ぶことが重要です。前の章で学んだ「目的を明確にする」ために必要なスキルでもあります。専門的な知識ではあるものの、ビジネスの構造や課題を理解したうえで、データ分析の目的を明確にすることが不可欠となるでしょう。
6.気をつけたいことは?
では、いざデータ分析してみます。しつこいようですが、手を動かす前に、気を付けたいことを復習しましょう。
1.目的は明確ですか?
データ分析をする前に、何を分析したいのか、どのような目的を持っているのかを明確にできていますか?データを集めることをゴールとせずに、分析結果が役に立つように設計をしましょう。
2.データの信頼性は?質は担保されていますか?
データの品質が悪いと、分析結果が間違ってしまうことがあります。データを収集する際には、信頼性の高いデータを収集することが重要です。また、データの欠損や誤りをチェックすることも大切です。
3.機械学習の限界を理解していますか?
機械学習を用いたデータ分析は、非常に効果的ですが、限界があります。機械学習がうまく機能しない場合もあるため、機械学習の限界を理解しておくことが大切です。
4.分析結果をわかりやすく伝えられていますか?
ただの数字の羅列になっていませんか?伝えたい分析結果を適切にグラフや表でまとめられていますか?結果とそこから得た洞察や仮説を相手がわかりやすいようにデータを適切な形で表現しましょう。
5.分析結果をビジネスに活用できていますか?
データ分析の結果をビジネスに落とし込むことは重要です。分析結果を実際のビジネスに活かすことで、経営判断の質を高めていきましょう。
7.まとめ
今回は、データ分析初心者、未経験者に向けたデータ分析の基本的な説明から心構えを紹介しました。 これから実際に手を動かし、ツールを使いこなすこともあるでしょう。
データ分析と一言で表現しても様々な用途と手法があります。闇雲に作業する前に、目的に立ち返り、どんなデータが必要でどんな方法があるのかを見極めましょう。また、社内にはデータ分析に詳しい人、ひいてはプロフェッショナルがいるはずです。データ分析は分野として非常に横に広く、奥が深いです。積極的に周囲にアドバイスを求めてみましょう。…というのは、個人的なアドバイスでもありますが、他者から助言を受けることは新たな視点を見つけるいい機会にもなります。是非勇気を出して聞いてみてくださいね。
ストラではお客様のデータ分析について、課題整理から目的・仮説設定を通したデータ分析支援はもちろん、データ分析基盤の設計・構築まで、実績をもったコンサルタントがご支援いたします。
お困りごとがございましたら、お問い合わせフォームより、お気軽にご相談ください。