超「Excel」とクラウドで実現するデータ分析環境

組織文化の変化を促す超「Excel」

「ビッグデータの時代」「アナリティクス3.0の時代」と騒がれても、 一般企業にはSASやSPSSといった統計処理ソフトをつかいこなせる人材はまだほとんどおらず、 分析人材は特殊なスキルとして外部調達することが一般的である。

最近は様々な分析ツールが登場し、導入を進める企業が増えてきた。 これらのツールはExcelと似たような操作感を提供したり、プログラミングの代わりにフローチャート状のGUIを提供しており、 データ分析が簡単にできることが売りだ。超「Excel」と呼ばれることもある。 超「Excel」は利用のハードルが低く、データを「いじれる」人間が大幅に増えることにつながる。 結果として、データを重視する文化を組織に根付かせることに大いに役立つであろう。

※超「Excel」ではクロス集計表の作成や相関分析をすることが多い。 単純な分析と感じるかもれないが、経験上、これだけでも多くの新しい知見が得られる。

超「Excel」でモデル構築をするか?

クロス集計の次のステージとして、回帰分析やクラスター分析、機械学習等によるモデル構築がある。 クロス集計では単純なセグメント分けしかできないが、これらの手法はセグメントの最適化ができ、施策等の効率を高められる。

この段階では統計的な知識が避けて通れないため、一気に敷居が高くなる。 超「Excel」側の対応も2パターンに分かれる。「対応する」か「しない」かだ。 対応すると高機能になるが、反面、使い方が難しくなることが避けられない。 クロス集計で9割のニーズを満たせるのであれば、対応しないでわかりやすさに徹するのも一つの方針だ。

ユーザ側としては悩ましい。 残り1割のニーズを満たす必要があれば、別途専門のツールを導入することになる。 少数のニーズのために別途投資することは社内の説得が難しい。 とはいえ、統計処理にも対応したツールは難易度が上がる。 せっかく導入したツールが使われなくては、元も子もない。

Rとクラウドが提供する本格的かつ安価な分析環境

筆者としては、とにかく簡単な超「Excel」をおすすめしたい。 従来型の意思決定をデータに基づく意思決定に変えることはそう簡単ではない。 トップの音頭が必要だと言われているが、本当に社内に浸透するには 中間管理職が変わる必要がある。 データ分析が本務ではない彼らがデータオリエンテッドな思考に慣れるには、 極力敷居を下げなくてはならない。

簡単な超「Excel」を選択しても、統計処理もあきらめない方法はある。 たとえば、MicrosoftのAzureでは、機械学習・統計処理のツールを クラウドサービスとして提供している。 こういったサービスを活用することで、低コストで高性能な分析環境を用意することができる。

Azureの機械学習エンジンは、オープンソースの統計解析ソフト「R」である。 専門知識の塊である統計解析ソフトをゼロから開発しなくてよいため、他にもRを採用するベンダーは多い。 Rが競争環境を作り出し、コスト削減につながっている。

高価なツールを購入するか、無償だが大量データ処理に不向きなRを使うしかなかった 機械学習・統計処理ツールの分野にもクラウド化の波は広がり、このジレンマは解消しつつある。

アナリティクス3.0には組織、人、システムでの対応が必要だ。 専門的な人材を外部調達するか、社内育成するかは組織の方針に依るが、 いずれにせよ多くの場合分析環境を整える必要が出てくる。 また、分析結果に基づいて施策等を実施していくためには、 データ活用という考え方が社内に広く浸透していなくてはならない。 超「Excel」で裾野を広げ、深堀にはクラウドを活用する。超「Excel」とクラウドの活用は、 データ活用文化の醸成と人材高度化を同時に進める仕組みとして、有力な候補となろう。