「データマイニング」という言葉を初めて目にしたのは、93年頃だった。日経コンピュータに特集記事があるのを偶然発見し、高度な分析技術を駆使して、大量のデータから新たな法則性を見出すという概念に魅了されたのを覚えている。
当時は、ニューラルネットワークを活用した分析が注目されており、デシジョンツリー(決定木)のような現在主流の技術はまだ未発達だった。
データマイニングは、今ようやく顧客分析の切り札として活用されるようになり、分析技術はさらに洗練化・高度化されつつある。
ただ、実際に分析をやる立場の人間として感じてきたのが、データマイニングを駆使してもあたり前の結果しか得られない、ということだった。
「カレーのルーを買う客は、福神漬けを同時に買う可能性が高い」 br
「年齢が高いほど、年収が多い」
「それがどうした?(so what?)」と言いたくなる。
分析の主な目的は、経験的にそうだろうと考えられていること、すなわち「仮説」をデータ的な裏付けを取り、検証することだから、上記のような結果も無意味ではないが、なにか物足りない・・・。
ここで、先日のCRM Expoで、インテージ(旧社会調査研究所)が興味深いデータマイニング事例を発表していたので簡単に紹介したい。
クライアントはある東北のリゾート施設。閑散期となる冬季の施設稼働率上昇のために、どのようなマーケティングが有効か、が課題である。
インテージは、早速、顧客データをデータマイニングにかけ、プロモーションターゲットとして反応率の高いと思われる既存顧客層の抽出を試みた。
まず最初の知見は、
「冬季に訪れている顧客は再び冬季に当該リゾート施設に来る確率が高い」
だった。うーむ、そりゃそうだろう。
次の知見は、
「当該施設が季刊で出している紙の情報誌を購読(無料)している顧客はリピートする確率が高い」
である。これも納得。
もう一つの知見はこうだ。
「情報誌を購読していないが、何度か来ている顧客はやはりリピートする確率が高い」
この最後の分析結果も当たり前といえば当たり前だが、実は大きな意義をもっていた。というのも、このリゾート施設では、情報誌を購読している顧客が反応率のいい優良客であるという仮説を持っており、販売促進の対象として、非購読者にアプローチすることは考えていなかったのである。
当該リゾート施設では、この分析結果に基づき、情報誌を購読していないリピート客に対して、別の形で販売促進施策を行うことを決めたという。
これは、データマイニングによって、間違った思い込みで形成された仮説が棄却されたケースである。
我々は、業務に追われる状況の中では、データに頼らず、経験と勘だけで判断しようとする。それはおおむね正しいことが多いのだが、上記のような間違った思い込みをしてしまい、大きな収益機会を逃しているのかも知れない。
データマイニングの本質は、仮説を検証することより、むしろ、データ自体が持つなんらかの法則性、知見を見出そうとすることにある。
仮説を持つことは重要だが、仮説にこだわることなく、データ自体が語る事実を素直に見つめる努力をすることが重要だ。そうすれば、データマイニングは効く!
Data mining = Fact speaks for itself
|