miniレクチャー

miniレクチャー

データサイエンス

「ごいっしょに、コーヒーはいかがですか!」 ~買い物カゴの中身を分析~

え?! そんな組み合わせって、あり?

カナダのスーパーマーケットで・・・
──紙おむつ売り場の横に置いておくと、ともによく売れる商品は何でしょう。
──???……
──答は缶ビールです。
──え?! さすが西洋は違う。赤ちゃんのときからお酒を飲むんだ……

真相はこうです。とあるスーパーマーケットが、各支店の販売データ(毎日毎日のデータなので量は膨大)をコンピュータで分析してみると、紙おむつを買った人はビールを買うという傾向が見つかった。そこで、この2つを並べて陳列することで、両方の売り上げを伸ばした、というものです。これは、母親がかさばる紙おむつの購入を父親に頼み、店に来た父親はついでに缶ビールも買っていくことが多いことから、起こり得る傾向だったというわけです。言われてみれば当たり前のことでも、データの分析がなければ気づかなかったこと、大量のデータの中から見えてくる人の行動傾向、こういったことにデータサイエンスは活躍しています。
1つの買い物カゴにどのような商品が入っているかを分析することをバスケット分析といいます。紙おむつと缶ビールのように、「合わせ買い」商品を発見するマーケティングの手法です。
(この紙おむつと缶ビールの話は、データマイニングの典型的な例としてよく紹介されますが、実際は、作り話だと言われています。しかし、話としてはよくできていて、実際には、こういった合わせ買いの例はたくさんあります。)

合わせ買いから購入傾向を知る

別の例をみてみましょう。

図1は,あるコンビニエンスストアのレシートです。これを見ると,淹れたてコーヒーとパンを買ったことがわかります。「合わせ買い」ですね。他に,買った日時や払った合計金額がわかりますが,残念ながら,これ1枚ではそれ以上のことはわかりません。ましてや,この1人の行動をもって,紙おむつと缶ビールのような「傾向」が見つかったなどということはできません。


図1 コンビニのレシート

そこで,複数の人の買い物の様子(買い物かごの中身)を集めてみます。20人分の様子を一覧表にしたのが表1です。買い物をした商品のところに「1」が入っています。これで,平均的な購入商品数やよく買われている商品がわかるようになりました。

表1 20人の買い物の様子

そして,これをさらに,表2のように,縦横の表に集計し直してみます。「合わせ買い」,つまり,「○を買った人は△も買っている」という集計です。左端に○にあたる商品を,上側に△にあたる商品を配置して,クロスする欄に,○を買った人の中で△を買った人の人数を入れていきます。たとえば,「淹れたてコーヒー」を買った人の中で「スナック菓子」を買った人は,No.2だけですので,「淹れたてコーヒー」を右にたどり,上の「スナック菓子」と交差する欄(1行4列)には「1」が入ります。同様に,「淹れたてコーヒー」を買った人の中で「パン」を買った人は,No.1,11,14の3人ですので,1行6列に「3」が入っています。No.11の人は,「ジュース」と「スイーツ」も同時に買っていますので,「淹れたてコーヒー」と「ジュース」の欄(1行2列)および「淹れたてコーヒー」と「スイーツ」の欄(1行7列)に,それがカウントとされています。
これをすべての商品に対して行った結果が,表2ということになります。

表2 合わせ買い数

さて,このようにすると,「○を買った人は△も買っている」という事象にある傾向が見えてきます。ただし,上にも書いたように,傾向があるというには,ある程度の人数が必要です。雑誌を買ったのは2人しかいませんが,その2人がともにジュースを買っているからといって,「雑誌を買う人は必ず(100%)雑誌を買うぞ」と結論してしまうのは,ちょっと軽率ですね。そこで,ここでは,20人の3分の1以上の人が買った商品をみることにして,購入総数が6以上のものに注目します。表3は,そうやって取り出した商品の合わせ買い率(合わせ買い数÷○の商品の購入総数)を求めたものです。

表3 合わせ買い率(購入数6以上の商品)

これより,「ジュース」を買った人のうち78%の人が「パン」を買っているとか,「お茶」を買った人のうち78%が「弁当」を買っているという合わせ買いの傾向がわかります。「スイーツ」を買った人は全員(100%)「淹れたてコーヒー」を買っていますし,「弁当」を買った人もその88%が「お茶」を同時購入しています。商品陳列の参考になる情報が取り出せました。一方,このことから,もし,「スイーツ」を買おうとしている人に「淹れたてコーヒー」をお勧めすると,買ってくれる可能性が高いと予想できますね。「弁当」を買おうとしている人に「お茶」をすすめるのも同様です。それぞれの売り場に,合わせ買い傾向の高い商品を陳列するのも手ですね。

毎日毎日の何百、何千の顧客(カゴ内の商品)のデータを分析して、役に立つルールを発見していくこと,これをデータマイニングといいます。「マイニング」とは「採掘」のことで、膨大なデータを「鉱山」に見立て、そこから未知の規則(鉱石・宝石)を発掘しようという意味です。そう、レジでバーコードをピッと認識しますよね。あのバーコードには、商品名や価格が記録されているので、レジを通ったバスケットごとにそのデータが蓄えられていきます。上のような分析も,実際は,この購買データ(POSデータ,Point of Salesデータ)を用いて行われます。
買う予定にしていなかったものをついつい買ってしまう「ついで買い」(結果として「合わせ買い」),から揚げなどのホットスナックを購入するとき,目の前に置いてある炭酸飲料を思わず手にしてしまうのは,お店がデータサイエンスを駆使した成果(・・・術中にはまっている・・・)かも。

 

[クリックして拡大表示します。]

このページのトップへ