ナレッジグラフを使った解釈可能な推薦システム

The English version is available here.

こんにちは。メルカリで 8 月から機械学習エンジニアのインターンをしている @joisino_ です。インターンでは、ナレッジグラフを使った推薦システムをメルカリの実データを用いて検証を行いました。その結果をこの記事で紹介します。

ナレッジグラフとは?

ナレッジグラフ(知識グラフ・ナレッジベース)とは、様々な知識を一つの巨大なグラフにまとめたデータベースです。たとえば、本のデータの場合、本そのものや著者や出版社などがグラフのノードになり、どの本がどの著者によって書かれたか、どの出版社がどの本を出版したといった関係が辺によって表されます。

世の中には DBPediaYAGO など様々なナレッジグラフが公開されていますが、今回は推薦システムを作るにあたって、メルカリのカタログデータから独自のナレッジグラフを構築しました。カタログデータは以下のような形式になります。

タイトル 著者 出版社 ターゲット カテゴリ
ぼくは王さま 和歌山静子/寺村輝夫 理論社 幼児
あいうえおうさま 和歌山静子/寺村輝夫/杉浦範茂 理論社 幼児 仮名

以下の図が、構築したナレッジグラフの一部分を図示したものと、その中から上の表に対応する部分を拡大したものです。

f:id:joisino:20190828142132p:plain:w400:left f:id:joisino:20190828142101p:plain:w400

ナレッジグラフの属性ノードの情報を活用することで、お客さまが以前に購入した本と同じ著者の本を推薦するといった、商品情報をもとにした推薦が可能になります。

モデルについて

知識グラフを使った推薦は HeteRec [Yu et al., 2014] をはじめ、数年前から盛んに研究されています。今回はそのなかでも解釈性が高く、大きなデータにもスケールする KGCN [Wang et al., 2019] をもとにモデルを作りました。KGCN はグラフニューラルネットワークをもとにしたモデルです。技術的な詳細については英語版の記事を参照してください。

実験

以下の 3 つのタスクをメルカリの本のデータを使って実験することで、ナレッジグラフを使った推薦の有効性を確認しました。

  • 商品推薦
  • 商品・商品推薦
  • 著者・著者推薦

定量的な評価や速度の評価など、技術的な実験結果については英語版の記事を参照してください。

商品推薦

まずは基本となる、お客さまに対して商品を推薦するタスクの実験を行いました。ここでは、実際のお客さまの購入履歴を公開することはできないので、仮想的なお客さまの購入履歴を作成し、その仮想的なお客さまに対する推薦結果を紹介します。

以下の表は、左列の 10 件がお客さまの購入した商品履歴で、右側の 10 件がこのお客さまに対する推薦商品です。購入履歴と推薦商品の行は対応しているわけではなく、それぞれ独立していることに注意してください。また、右側にある推薦理由はモデルによって自動で生成されます。このような理由を提示することで、納得感の強い推薦になっているかと思います。解釈性を伴った推薦ができることも、ナレッジグラフを使った推薦システムの大きな強みのひとつです。

まずは、小さいこどもを持つ裁縫好きの主婦・主夫を想定して作ったお客さまです。推薦商品を見てみると、こども服の裁縫に関する本が中心に推薦されています。

お客さまが購入した商品 推薦商品 推薦理由
おうちで給食ごはん 小さくてもきちんとした服 洋裁(子ども服)に関する本のため
愛情いっぱい手作りの赤ちゃん服 かんたん!かわいい!はじめての赤ちゃん服と小物 洋裁(子ども服)に関する本のため
ハンドメイドベビー服 きれいに縫うための基礎の基礎 洋裁に関する本のため
いちばんよくわかる赤ちゃんと小さな子の服 女の子のまいにちの服 洋裁(子ども服)に関する本のため
3歳からのおべんとう 女の子のシンプルでかわいい服 洋裁(子ども服)に関する本のため
ぼく、アンパンマン! 簡単に作れて、とことん使える日常着 洋裁(婦人服)に関する本のため
ちくちくはじめて赤ちゃんスタイ 初めての育児 ひよこクラブによる出版のため
ワンポイント刺しゅう図案365 女の子のおしゃれ服 洋裁(子ども服)に関する本のため
1色刺繍と小さな雑貨 おしゃれが好きな女の子の服 洋裁(子ども服)に関する本のため
あかちゃんのために作るもの 子供服ソーイングLESSON BOOK 洋裁(子ども服)に関する本のため

次に、東野圭吾や百田尚樹の小説が好きということを想定して作ったお客さまです。推薦商品と理由を見てみると、東野圭吾の小説が中心に推薦されています。

お客さまが購入した商品 推薦商品 推薦理由
西の魔女が死んだ 危険なビーナス 東野圭吾による著作のため
ナミヤ雑貨店の奇蹟 祈りの幕が下りる時 東野圭吾による著作のため
マスカレード・イブ マスカレード・ナイト 東野圭吾による著作のため
陸王 パラレルワールド・ラブストーリー 東野圭吾による著作のため
下町ロケット 新参者 東野圭吾による著作のため
夢幻花 悪意 東野圭吾による著作のため
幸福な生活 ラプラスの魔女 東野圭吾による著作のため
影法師 眠りの森 東野圭吾による著作のため
流星の絆 ルビンの壺が割れた 新潮社による出版のため
アキラとあきら フォルトゥナの瞳 百田尚樹による著作のため

最後に、文系の高校生・受験生ということを想定して作ったお客さまです。推薦商品を見ると、高校生向けの参考書を推薦できています。また、このお客さまが購入したことのある「大学入試全レベル問題集現代文」や「パラグラフリーディングのストラテジー」の続編を推薦できています。

お客さまが購入した商品 推薦商品 推薦理由
漢文ヤマのヤマ 漢文道場 Z会による出版のため
得点奪取現代文 古文上達 仲光雄による著作のため
パラグラフリーディングのストラテジー 1 大学入試全レベル問題集現代文 3 高校生をターゲットとした本のため
大学入試全レベル問題集現代文 1 中堅私大古文演習 高校生をターゲットとした本のため
大学入試全レベル問題集現代文 2 実力をつける日本史100題 Z会出版編集部による出版のため
実力をつける世界史100題 パラグラフリーディングのストラテジー 2 高校生をターゲットとした本のため
はじめる日本史 要点&演習 古文 高校生をターゲットとした本のため
生物〈生物基礎・生物〉基礎問題精講 センター試験現代社会集中講義 高校生をターゲットとした本のため
センター古文満点のコツ 「源氏」でわかる古典常識 高校生をターゲットとした本のため
金の漢字最強編 大学受験 大学入試全レベル問題集現代文 4 高校生をターゲットとした本のため

商品・商品推薦

次に、商品に対して別の商品を推薦するタスクの実験を行いました。こちらは商品ページに関連商品として提示することを想定しています。「この商品を買った人は、この商品も購入しています」を思い浮かべるとわかりやすいかと思います。以下の表が、実際にモデルが出力した商品・商品推薦の結果です。一番上の行が元にする商品で、二行目以降が、その商品に対する推薦商品です。関連の強い商品が推薦されていることが見て取れます。

クエリ
アンパンマンのパトロール
高校入試でる順ターゲット中学英単語1800練習ノート
はじめてのゲーム理論
1 位 メロンパンナのはなばたけ 高校入試でる順中学英単語練習ノートターゲット1800 ゲーム理論・入門 人間社会の理解のために
2 位 ロールパンナとカレーパンマン 高校入試グループでまとめて覚える中学英単語 ゲーム理論ワークブック
3 位 きれいにしようねみんなのて 高校入試でる順ターゲット中学英熟語380 ゲーム理論
4 位 アンパンマンのおいしいなかまたち 高校入試スーパーゼミ英語リスニング 新版 ゲーム理論・入門 人間社会の理解のために
5 位 ともだちいっぱい 中学英語レベル別問題集 高校受験 1 マクロ経済学
6 位 アンパンマンとおかいもの すっきりわかる中学英語長文1~3年 マクロ経済学入門
7 位 アンパンマンとアイウエオ 英文法パターンドリル 英文法はくり返し書いて覚える 中学1年 入門社会経済学 資本主義を理解する
8 位 しょくぱんまんとトースターマン 英文法・英作文問題精講 高校入試 都市・地域経済学への招待状
9 位 アンパンマンとすいぞくかん 中学英語レベル別問題集 高校受験 2 経営学で考える
10 位 やきそばパンマンとめいけんチーズ 英文法パターンドリル 英文法はくり返し書いて覚える 中学2年 マクロ経済学

著者・著者推薦

今回使ったモデルは、商品やお客さまだけでなく、著者やカテゴリといった属性ノードについても埋め込みが得られるので、お気に入りの著者に対して他の著者を推薦するといった属性に対する属性の推薦も可能になります。お気に入りの著者の著作を読み尽くしたあと、その著者に似た別の著者を見つけるのに苦労することも多いので、このような機能があるといかに便利かは納得いただけるかと思います。このような属性どうしの推薦が可能なのもナレッジグラフを使った推薦の強みです。

以下の表が実際にモデルが出力した著者・著者推薦の結果です。たとえば、東野圭吾には、辻村深月や湊かなえといったミステリ・推理作家が推薦されています。また、池上彰には、同じくビジネスパーソン向けの解説書などを多く執筆する齋藤孝、茂木健一郎、林修が推薦されています。「ジョジョの奇妙な冒険」で有名な漫画家の荒木飛呂彦には、「進撃の巨人」で有名な諫山創や「鋼の錬金術師」で有名な荒川弘が推薦されています。有元葉子は料理研究家として多くの主婦・主夫向けの料理本や暮らしについての本を執筆している方です。彼女に対しては、同じく料理研究家のワタナベマキや、暮らしについての本を執筆する柳沢小実が推薦されています。

クエリ
東野圭吾
伊坂幸太郎
池上彰
荒木飛呂彦
有元葉子
1 位 辻村深月 有川浩 齋藤孝 諫山創 ワタナベマキ
2 位 湊かなえ 東野圭吾 茂木健一郎 荒川弘 柳沢小実
3 位 薬丸岳 朝井リョウ 林修 小畑健 石村由起子
4 位 西加奈子 恩田陸 古市憲寿 石田スイ 石井佳苗
5 位 三浦しをん 荻原浩 塚本亮 森薫 梶晶子
6 位 雫井脩介 西加奈子 池谷裕二 長月達平 中川たま
7 位 伊岡瞬 中村文則 野中香方子 堀越耕平 山脇りこ
8 位 芦沢央 真梨幸子 テレビ東京報道局 冨樫義博 青山有紀
9 位 池井戸潤 乾くるみ 岸見一郎 小太刀右京 三宅郁美
10 位 村田沙耶香 島本理生 外山滋比古 押見修造 渡辺有子

この例の他にも、お客さまへの著者の推薦や、商品に対する関連著者の推薦など、ナレッジグラフを用いた推薦システムは様々な応用が可能になります。

おわりに

この記事では、今回のインターンで行った、ナレッジグラフを使った推薦システムの検証を紹介しました。実験では、解釈可能な推薦や、属性間の推薦など、従来の協調フィルタリングベースの推薦では不可能だったタスクが実行可能になったことを確認しました。このナレッジグラフを使った推薦システムにより、より良い体験をお客さまにお届けできるようになると考えています。

ここまでお読みいただきありがとうございました。楽しんでいただければ幸いです。

参考文献

Hongwei Wang, Miao Zhao, Xing Xie, Wenjie Li, Minyi Guo. Knowledge Graph Convolutional Networks for Recommender Systems. WWW, 2019.

Xiao Yu, Xiang Ren, Yizhou Sun, Quanquan Gu, Bradley Sturt, Urvashi Khandelwal, Brandon Norick, Jiawei Han. Personalized entity recommendation: a heterogeneous information network approach. WSDM, 2014.