メニュー

ビッグデータとAI:顧客管理(CRM)の基礎知識6

顧客管理(CRM)の基礎知識

更新日:2021年9月22日(初回投稿)
著者:東京大学 大学院 経済学研究科 マネジメント専攻 経営講座 教授 阿部 誠

前回は、1to1マーケティングにおける4Pの側面について解説しました。最終回となる今回は、顧客管理におけるビッグデータとAIの応用について紹介します。

今すぐ、技術資料をダウンロードする!(ログイン)

1. ビッグデータで何ができるのか

ビッグデータは、データの収集、取捨選択、管理および処理に関して、一般的なソフトウェアの能力を超えたサイズのデータ集合と定義されています。情報技術の発達は、さまざまなタイプのデータを日々、大量に生み出しています。その結果、一人ひとりの顧客を深く理解し、より効果的なマーケティングを実践するための情報が、以前とは比較できないレベルであふれています。こうしたビッグデータは、分析に至らなくとも、ユーザーによる評価や投稿レビュー、顧客の好みを学習したレコメンデーションシステムなどで顧客のスイッチングコストを高め、企業の競争優位の武器にもなり得ます。しかし裏を返せば、ここから有用な知見や知識を得られなければ、これらは保存するに値しない単なるごみとなってしまいます。現在、多くの企業は、このビッグデータからいかに有用な情報を抽出し、マーケティングに利用するかに行き詰まっている状態です。

ビッグデータは、Volume(容量)、Variety(多様性)、Velocity(速度)の3次元で特徴付けられます。そこからVeracity(正確性)とValue(価値)を導き出すことが、今、ビジネスにおける最優先の課題になっています。

2. データの山から宝を探せ! — データマイニングとAI

データマイニングとは、大規模なデータから有用な情報を抽出するプロセスのことで、計算速度や実用性を重視し、解析の探索的な側面が強調されます。そこでの解析手法は、目的(従属)変数の有無とアプローチによって分類することができます(図1)。

図1:データマイニングの4つの分類とAI(引用:阿部誠、大学4年間のマーケティングが10時間でざっと学べる、KADOKAWA、2017)

図1:データマイニングの4つの分類とAI(引用:阿部誠、大学4年間のマーケティングが10時間でざっと学べる、KADOKAWA、2017)

マーケティングで使われる代表的なデータマイニングには、アソシエーションルール、クラスター分析、回帰分析、判別分析などが挙げられます。この4つについて説明します。

・アソシエーションルール
アソシエーションルールとは、どの商品が併買(へいばい:同じ売場にある任意の商品を一緒に購入すること)されやすいかを、大量の購買データから自動的に抽出する手法です。これは、店舗の棚割りやレコメンデーションに重要な示唆を与えます。

・クラスター分析
クラスター分析とは、過去の購入商品の種類によって顧客を分類する手法です。セグメント別に適切なプロモーションを仕掛けることができます。

・回帰分析
回帰分析とは、連続値をとる従属変数と説明変数との関係を推定する手法です。例えば、コンビニの需要予測では日時、天候、近隣のイベントなどが商品別の販売量にどう影響するかを、過去の販売データを使って分析します。

・判別分析
判別分析とは、従属変数が離散的な場合の回帰分析と解釈できる手法です。顧客の所属するRFM分析のクラス、あるいは顧客が、購買するか否かを、顧客のデモグラフィック特性に関連付けたりします。

データマイニングに使われるAIにはさまざまな定義があります。総じて、機械学習を発展させることによって、意思決定の能力が加わったものと解釈してよいでしょう。1950年代後半に考案されたニューラルネットワークによって、AIの1次ブームが起こりました。現在の3次ブームは、ディープラーニングの実用化によってもたらされたとはいえ、その背景にはビッグデータと膨大な計算を並列処理で可能にしたハードウェアの発達があります。

3. AIのわな — ビジネスでAIを用いる際の2つの弱点

ビジネスに適用する際、AIには2つの弱点があります。第1に、AIは相関関係を見つけることに長(た)けている反面、因果関係を導くことは不得手です。この弱点がさらに深刻化するのは、AIの出した結果を見た人間が相関を因果と誤判断し、意思決定を行ってしまうことです。

例えば、あるビールブランドの、昨年夏の地区別売上と広告量を含んだビッグデータをAIで分析した結果、広告が増えると売上が大幅に伸びることが分かり、今年の夏も広告量を増やすことにしたとしましょう。この意思決定では、「1:広告が売上を増やす」という因果関係を仮定しています。しかし、「2:売上が伸びた地区は、追加予算が配分されたため広告量を増やした(逆因果)」、あるいは「3:猛暑で売上が(広告とは無関係に)増えたと同時に、猛暑で売れそうな地区の広告量を会社が増やした(猛暑=交絡因子:因果の判断を惑わす要因)」という可能性はないのでしょうか? 図2はAIの弱点と、因果関係を証明するためのプロセスを示します。

図2:AIの弱点と、因果関係を証明するためのプロセス(引用:阿部誠、[図解]大学4年間のマーケティングが10時間でざっと学べる、KADOKAWA、2018)

図2:AIの弱点と、因果関係を証明するためのプロセス(引用:阿部誠、[図解]大学4年間のマーケティングが10時間でざっと学べる、KADOKAWA、2018)

この図は、x=広告、y=売上、z=猛暑とおいた場合の、1~3の関係を表しています。真の因果関係を確立するためには、事実(実際に起こったこと)と反事実(仮に○○をしなかったらどうなっていたかという、実際には起こらなかったこと:Counterfactual)とを比較する必要があります。しかし、「もしも」は観測できません。唯一の解決策は、比較可能とみなせるグループで反事実を観測する「ランダム化比較試験(RCT:Randomized Control Trial)」と呼ばれる実験です。RCTとは、研究の対象者を2つ以上のグループにランダムに分け(ランダム化)、効果を検証することです。ランダム化により検証したい方法以外の要因がバランスよく分かれるため、公平に比較することができるとされています。しかし、AIは自ら実験を行うことはできない上、使用されるビッグデータは観測データに過ぎません。

また、RCTが行えないときに、観測データから因果関係を導き出すための手法として、自然実験、回帰不連続デザイン、操作変数法、差の差分析、その他マッチングなどがあります。これらの手法では、妥当性のある反事実を創り出すための、消費者行動などの理論が重要になります。

では、AIの2つ目の弱点とは何でしょうか?

4. ビッグデータのパラドックス — データが足りない!?

続きは、保管用PDFに掲載中。ぜひ、下記よりダウンロードして、ご覧ください。

ピックアップ記事

tags