パラシュートグループ

スタッフブログ

スタッフブログ

2011年07月19日

分析にかかる時間の割合

藤林です

分析業務にかかる時間の割合が一番高いのはどこでしょうか?

多くの人は、「結果を解釈すること」と答えるかもしれません。
あるいは、グラフを作っている時間?と思うかもしれません。
イメージとしては、専門の統計ソフトを駆使しながら、
ああだこうだと考えてる姿でしょうか。



実際に行っている立場から見ると、現実はそうではないなぁというのが第1感です。

 

では、実際は、どこに時間がかかるのか?といいますと、
「データを使える状態に持っていくまで」に時間がかかります。

 

もちろん、全分析業務では無いとは思います。すぐ思いつくだけでも、例外はあります。
アンケート業務などの場合は、回答データの収集は、近年はWEBによることが多いです。
プログラムによる回答チェックがなされますから、”汚いデータ”はそう多くありません。
その場合でも、比重は、”調査設計”に重きが置かれるとは言えます。
なぜなら、”設計”に失敗すると、”読み解く”以前に回答データそのものが破たんするからですね。

 

さて、弊社は、アンケートよりはPOSデータ・購買データを対象にすることが多いです。
当然ですが、POSデータ・購買データはアンケートのように”調査・分析のためだけに”収集するものでは
ありません(在庫管理、販売管理etc...)

 

従って、まぁ、きれいか・汚いかでいえば、汚いのです(多様な目的を含みますから)。
そのままでは、少なくとも”購買分析用の”データでもなんでもなく、
数字の集合体そのものです。

 

イメージとしては、アンケートデータがスーパーで売っている加工済みの肉。
フライパンで焼いて塩コショウでもふれば、とりあえず食べられないことはないでしょう。たぶん。
POS・購買データは、牛や豚1頭まるままそこにあるようなイメージです。

 

つまり、まず、「データを使える状態に持っていか」なくては始まりません。
(牛や豚をばらして、肉の状態にするイメージです)
実際、これに時間の6割・7割はかかります。
エクセルやパワポよりもテキストエディタばかりいじる日もあります。
(表計算ソフトよりも、データベース構築、データ修正・データ加工etcが山のように待っている状態です)



従って、どうしても、「最初に行う時」、「初めて取り組む分析の時」、「今までと違うデータの時」
は、異常なほど、神経質にならざるを得ません。

 

そこを適当にやると、肉の中に病原菌がいて、後で、関係者全員食中毒になりましたという
自体が起こる可能性があるからですね。

 

自分自身も、クライアント先に行ってお話をすることが多いですが、
「営業担当」としての自分と、「分析担当」としての自分での葛藤は、あります。

 

「営業担当」として話せば、牛や豚のばらし方など細かいことは、なんというかスルーしたいものです。
アクションするために分析するのですから、データ自体の細部構造など、究極どうでもいいわけです。
(話題や将来へ向けたアクションとしては、ひじょぅ~~~~に、脇の話ですので)


一方、
「分析担当」として話せば、後で、食中毒を起こすわけにはいかないわけです。
前提数値を作っても、後で、全然前提が違いました。データにありえないことがありました(集計があっていても)。
では、案件自体がとん挫の勢いです。

 

一例をあげれば、基本事項ですが、例えば、売上点数に「まさかの」NULLがあったとしましょう。
通常考えられないので、売上点数×売上単価と計算しますと
 NULL × 2 = NULL
になってしまいます。NULLは空白と違います。何もないというイメージで結構です。
また、平均を求めるとき、NULLは分母にカウントされないため、
0 と NULL では全然数値が変わる可能性があるわけですね。


 

弊社に限らず?
とかく、設計や分析担当者が来ると、やたらめったら細かい話ばかりして眠いなぁとお思いの
クライアント様も多いかもしれません。

 

その時は、
いざという時の食中毒を起こさないために、の必要なことだとご認識をいただければ
大変幸いなことでございます。

 

藤林

PAGETOP