2014.07.24
それってホントに『分析』?|freee データマイニングエンジニアに学ぶ本質的なデータとの向き合い方

それってホントに『分析』?|freee データマイニングエンジニアに学ぶ本質的なデータとの向き合い方

アナタのデータ分析はただの「現状分析」かもしれない!?明日から使える「データ」への向き合い方と考え方をfreeeのデータマイニングエンジニア坂本さんに教えてもらいました。

0 0 272 0

データ分析→活用、ホントに出来てる?

昨年辺りから、ビックデータやデータサイエンティストがある種「バズワード化」して久しいですね。

ただ、データというものは決してプロフェッショナルだけが扱うものではありません。様々な業界・業種の人が日々、データと向き合っているもの。Excelが使えるからといって、「データ分析ができている」と勘違い…いや錯覚している人も多いのでは!?ここは基礎から、データの扱い方・考え方についてプロから学んでみましょう。

今回ご寄稿いただいたのは、10万以上の事業所が導入している「全自動のクラウド会計ソフト freee」でデータマイニングエンジニアを務める坂本さん。

明日から使える考え方が詰まっています。記事の最後には、オススメの書籍もレベル・業務別にご紹介いただきました!


freee 坂本登史文

[プロフィール]
freee 株式会社 データマイニングエンジニア
坂本登史文 Toshifumi Sakamoto

京都大学理学研究科修了後、メーカー系SIer、ディー・エヌ・エーを経て2014年3月からfreee株式会社にジョイン。データマイニングエンジニア兼グロースチームのリーダーをつとめる。定量的なデータを元に、サービスを拡大するための戦略づくりと実行に励む毎日。


こんにちは。freee 株式会社 データマイニングエンジニア 坂本登史文です。
あなたの周りにあるたくさんの「データ」。これらを活用できていますか?うまく活用できているかたも、まだまだこれからの方もいらっしゃると思います。本記事では、データ活用の失敗例をお話ししながら、本質的なデータとの向き合い方をお伝えします。

陥ってはいけない!ロースハラミ現象とは

では早速、突然ですが、データ活用の失敗例である「ロースハラミ現象」をご紹介します。焼肉店のデータ分析担当になった気持ちで読んでいただければと思います。

あなたはとある焼肉店のデータ分析担当として働いています。このお店、以前は比較的好調に経営が出来ていたのですが、直近3ヶ月で売上が下がってきています。

そこであなたは店長から「売上が下がっている理由を分析してほしい」と依頼されました。

あなたは手始めとして、いろいろな切り口で売上を分解してみることにしました。この焼肉店にはPOSと連動した売上分析ツールを導入してあります。これがあれば売上減少の原因特定など朝飯前です。

そこで、まずは売上を色々な軸で分解してみることにしました。焼肉店の売上を、[客数] × [客単価] で表したものが図1です。(※売上を4種の肉に限定。さらに6ヶ月前の売上、客数、客単価を1にしています)



この図から、直近3ヶ月の売上減少は、客数の低下ではなく、客単価の低下で説明できることがわかりました。 *

* ここで、回帰分析や多変量解析を行うアプローチもありますが、理解しやすさを優先し、平易なアプローチをとっています。このような分析を行った場合でも、性別と商品別売上のみを説明変数として与えると、本文と結論はかわらず、「客単価の減少の原因は、主力製品であったロースとハラミの客単価の減少である」という結論になります。

しかも、客単価の減少の原因は、主力製品であったロースとハラミの客単価の減少であることまで判明したのです!!POSと連動するデータ分析システムがなければこの結果がわからなかったでしょう。データ分析担当のあなたは売上低下の原因が判明し、鼻高々です。なにより自分が導入を推進した分析システムで、売上低下の原因がわかったのですから。

そして店長に報告します「売上低下の原因は、ロースとハラミの客単価が落ちたからです。」と。店長は「これはすごい!すぐに対策を打とう!」と言い、ハラミとロースをよりお客様に食べて頂くようなキャンペーンを行うことを決定しました。セット割、平日限定増量キャンペーン、ロースやハラミ中心の広告展開、出来ることは何でもしました。

--- しかしながら、キャンペーン実施後も目立った売上の回復はありませんでした。

なぜこのような失敗が起きたのでしょうか?

この失敗は、「直近3ヶ月で売上が下がっている理由は何か?」という問いに対して、「ロースとハラミが売れていないから」という現状把握に満足し、本質を捉えた分析を行っていないからです。このようにデータを現状把握のみに使用し、本質的な分析に活用されない現象を、「ロースハラミ現象」と私は呼んでいます。

本質を捉える分析

「ロースとハラミが売れていないことが、売り上げ低下の主要因です」というメッセージが現状把握であれば、本質的な分析とはいったいどういうものなのでしょうか?

本質的な分析というのは、「データを生み出した主体を洞察し、現状が起こった原因を考えること」です。

この焼肉の例でいうと、お客様(データを生み出した主体)の行動に着目し、「なぜロースとハラミが売れなくなったのだろうか?」という問いに答えるのが本質的な分析です。



では先ほどの例に戻りましょう。

なぜロースとハラミが売れなくなったのでしょうか?

ここから必要な考え方が、仮説検証です。仮説検証とは、まず様々な仮説を置き、それが妥当であるかどうか定量的/定性的に判断するというアプローチです。

この場合ざっと考えただけで、下記のような仮説が考えられます。**

** 仮説を出す行程では、3C分析、バリューチェーン、などの既知のフレームワークに沿って考えると、抜け漏れのない観点で網羅的に仮説を出すことができます。

<仮説>
 1. TVや雑誌の報道などで、全国的にロースとハラミを避ける傾向になった
 2. 客単価の高い常連さんが減り、その結果全体の客単価が下がった
 3. 利用シーンが変わった結果、主力のロースとハラミの売上が減少した

では一つ一つ検証してみましょう。


<検証>
1. TVや雑誌の報道などで、全国的にロースとハラミを避ける傾向になった

→ネットやレストラン口コミサイトをみた限り、そのような傾向はないようでした。
さらに、別支店の店長数人に話を聞いたところ、別支店ではロースやハラミの売上は好調とのことでした。よって、この説は棄却されます。


2. 客単価の高い常連さんが減り、その結果全体の客単価が下がった
→ハラミやロースを好んで召し上がっていた、常連さんたちの足が遠のいているのではないかという仮説です。

定量的にデータから迫ろうかとおもいましたが、残念ながら分析ツールには「新規・リピーター」を分割するためのフラグは持っていませんでした。ポイントカードがPOSに連携されていれば簡単に分析できたのですが、今回は定量的なアプローチは見送り、定性的に仮説を検証してみることにしました。

そこで、バイトリーダーに「常連さん減ったとかないかな?」と聞いてみましたが、「そのようなことはない」との返事でした。その証拠に、常連さんのボトル注文ノートを見せてくれました。それを見ると、6ヶ月間ボトルキープの売上は横ばいでした。どうやら常連さんの足が遠のいたわけではなさそうです。よって、この説も棄却しましょう。(ポイントカードのPOS連携は別プロジェクトとして始動させましょう)


3. 利用シーンが変わった結果、主力のロースとハラミの売上が減少した
→1次会と2次会では一般的に2次会の方が客単価が低いことに注目した仮説です。

これは定量的なデータから検証できます。分析システムから、お客様の数を21時以前と21時以降でセグメント分けして出力したものが図3です。



これをみれば一目瞭然です。売上が減少し始めた3ヶ月前から2次会の利用が増えていることがわかります。よって、この仮説の妥当性は高そうです。***

*** ちなみに、現状把握の際に回帰分析や多変量解析を行い、説明変数に時間帯別客数を選択していれば、21時以降の客数の増加と売り上げの減少に相関があるとすぐに気づくことが出来ます。

妥当性を高めるために、気心しれたお客様数名にそれとなく調査してみることにしました。そこで、2次会として来店してくださっている常連様に直接「1次会はどこに行かれていたのですか?」と聞いてみたところ、

「4ヶ月前にオープンした焼き鳥店」と答える方が大半でした。さらに、「安価な鳥肉をがっつり食べてからの、2次会でちょろっとうまい牛肉を食べる」というのが仲間内の定番だとも教えてもらいました。

よって、この仮説を妥当性の高い仮説として採用します。

このようなアプローチで、「直近3ヶ月の売り上げ低下の原因は何か?」という問いに対する本質的な答えが、「4ヶ月前オープンした焼き鳥店を中心に競合が増え、1次会の利用が減っているため」ということがわかりました。

つまり、ロースとハラミ自体に特別な原因があるわけではなく、ロースとハラミの売上を回復させようとした施策はあまり効果が出なかったというわけです。

データの海から離れてみる

焼肉店の話いかがでしたでしょうか?大半の方は、焼肉が食べたくなったと思いますが(笑)、「ロースハラミ現象」がどのようなものか伝わったでしょうか。

ぜひ明日から、データ分析を行った際には、結論が単なる現状把握になっていないかどうかチェックしてみてください。

ロースハラミ現象を脱却するポイントは、データをみながら「このデータが生まれる原因はなんだろう?」と、データを生み出した主体(ユーザー)に注目して仮説検証をすることです。仮説を考える際には、手元のデータを見る必要はありません。むしろデータを見ることで仮説の範囲が狭まってしまうこともあります。

データの海から離れて、焼肉でも食べながらユーザーの気持ちを考えてみるのもよいものですよ。

データ活用に必携の3冊

では最後に、データを活用するにあたってオススメの本を3冊ご紹介します。

戦略「脳」を鍛える

▽戦略「脳」を鍛える
Amazonリンク:(http://goo.gl/pfSXYH)
外資系コンサルタントがどのように戦略を作っていくのかがわかりやすく書かれた本。データ活用の本ではありませんが、データを使って論理的に物事を考え、最終的にどう施策に落とし込むのかという点で、データ活用の礎となる内容。


データサイエンティスト養成読本

▽データサイエンティスト養成読本
Amazonリンク:(http://goo.gl/Bt6Eb)
データ活用のTipsから、Fluentdによるログ収集環境の構築まで、データサイエンスの仕事を網羅的に紹介している本。データをこれから本格的に活用していきたい方にオススメの一冊。



Rによるデータサイエンス - データ解析の基礎から最新手法まで

▽Rによるデータサイエンス - データ解析の基礎から最新手法まで
Amazonリンク:(http://goo.gl/jLDnp)
これから統計解析向けのプログラミング言語のRを学んでいきたい人にオススメしたい本。多変量解析からニューラルネットワークまで、基本的な分析手法を数式や図を交えながら解説。Rのコードも豊富に載っており、この本1冊でとりあえず手を動かし始めることができる。


いかがでしたか?
データを取り扱う機会は今後よりいっそう増え、その責務も大きくなってくると思います。ぜひ皆さんも、単なる現状分析ではない「本質的なデータ分析」への一歩を踏み出しましょう。



編集 = 寄稿


特集記事

お問い合わせ
取材のご依頼やサイトに関する
お問い合わせはこちらから