データマイニングの幻想と現実

顧客行動を予測する

わが家にはほとんど毎日といっていいくらいダイレクトメールがやってくる。
しかし、そのほとんどは、目を通されることもなく、ゴミ箱に直行してしまう。
逆に、こちらが欲しいものがあるときには、きまってそういう案内はこない。 いうまでもなく、物を売る立場から見れば、
顧客がいつ何を欲しがっているかを正確に知ることは究極の情報だ。

客が次になにを買うかをピタリといいあてる、というのはちょっと無理だが、 何となくそこに法則性を見い出すことならできそうだ。
たとえば、 スーパーでさんまを買う人はダイコンも買うだろうから並べておいておくとか、
車を買って5年たった人に買いかえの案内を送ってみるとか …。 こういう法則は、過去の経験を通じてなんとなく覚えていくものだが、
手持ちのデータを使って、 役立ちそうな法則を簡単に見つけることができないだろうか ?
最近いろいろなところで、耳にするデータマイニングというのは、 どうやらそういうことをしてくれるものらしい。

データマイニングの幻想

コンピュータに蓄積されたデータから、 データ間の関連や新しい法則を見つけ出すことを データマイニング(マイニング=発掘)という。
データマイニングを半自動的に行なうツールもかなり出回っている。 顧客の購買履歴を分析することで販売促進を行ない、売上がアップしたとか、
クレジットカードの使用履歴データをもとに、不正使用を未然に阻止した、 といったような事例(*)は数多く報告されている。
それならばと、手持ちのデータをそのままデータマイニングツールに入れてしまえば、 宝の山が簡単に見つかるような気がするが、
はたして、そんなに簡単なことなのか ?

データマイニングの現実

データマイニングツールの中には、入力したデータ間の関係を調べて、 役に立ちそうな情報を自動的に抽出してくれるというものがある。
手持ちのデータを入力するだけで、売上倍増 ! となるような 法則が見つかるのなら、こんなありがたい話しはないのだが、
現実はそう簡単にはいかないようだ。 最初からわかりきっているような当たり前の結果が出てきたり、
とうてい信用できないような結果がでてきたりすることが多い。 また、仮に正しい法則が得られたとしてもそれが役に立つかどうかは別問題だ。
例えば、「掃除機を買ったお客はナスを買う」という法則が得られたからといって、
ナスの隣で掃除機を売っても、その店のセンスが疑われるだけだろう。

やはり楽せず探し歩こう

では、うまくやるにはどうしたらいいのだろうか ? 事前にやっておかなくてはならないことがたくさんある。

まずは、データの中身をよく調べること。 信頼できないデータや項目が欠けているデータがあると、
ノイズとなってしまう。相関の強い項目も排除した方がいい。 この種の事前分析は、Excel や手持ちの統計ツールなどで十分にできるので、
こういったものを使ってまず下調べをすることをおすすめしたい。 また、目的をはっきりさせておくことも重要だ。
売上をのばしたいのか、客層を広げたいのか。 こういったことでもサンプルとして与えるデータや項目が変わってくるからだ。

このように見てくると、 どうやらデータマイニングというのは、うまくいけば効果はありそうなのだが、 なかなか大変そうである。
徳川幕府の埋蔵金探しではないが、 汗をかいたからといって発見できるものでもないし、 そもそも宝がない場合もある。
ただ、苦労して捜し当てた宝は、より価値があるものに違いない。


本文中・関連のリンク: