【論文紹介】Multiple Pairwise Ranking with Implicit Feedback (CIKM2018) - 3月 05, 2020 こんにちは、ぐぐりら(@guglilac)です。 今回は、implicit feedbackからランキングを学習する手法に、Bayesian Personalized Ranking (BPR)を改善したMultiple Pairwise Ranking (MPR)について読んだのでまとめました。 論文リンク: [Multiple Pairwise Ranking with Implicit Feedback](https://dl.acm.org/doi/10.1145/3269206.3269283) ## 概要 implicit feedbackからランキングを学習する手法に、Bayesian Personalized Ranking (BPR)があるが、BPRでは未観測データをすべて等しく扱っていた。 本研究では未観測データをdislikeとunknownの二種類に分けて学習するMultiple Pairwise Ranking (MPR)を提案。 ## Multiple Pairwise Ranking with Implicit Feedback (MPR) BPRには、 * 観測されたitemは未観測itemよりも好まれる * 各userの好みは独立 という仮定が置かれていました。 MPRでは一つ目の、unobservedなitemを一緒くたにしていたBPRの仮定を緩和しています. unobservedなitemを二種類に分解します。 * dislike * unknown 分解したら、 * observed-dislikeの差 > unknown-dislikeの差 > observed-observedの差 になるように学習します. ## 個人的な疑問と考察 observed > unknown > dislikeの順になるように学習せずに、このようなlossの設計にしているのは何か理由があるのでしょうか? この二つの設計の差として、MPRでは observed > dislike > unknown の順になることも許容できる点があります。 unknownはviewしていないデータなので、シグナルとして二面性があると考えているのかも?と思いました。 * 見ているということは少なからず興味がある(正例の兆し) * 見ているのにfeedbackがないのは興味がない(負例の兆し) viewの扱い方はこちらの論文紹介記事でも書いています。 【論文紹介】Sampler Design for Bayesian Personalized Ranking by Leveraging View Data ## データセットの分け方 dislikeとunknownの分け方は色々ありますが、論文中では二つの方法を紹介しています。 * purchasedの他にclickの情報がある場合 * 人気度の情報を用いる方法 一つ目のclickの情報を使う場合は、clickしたけどnot purchasedなものはdislike、clickされていないものはunknownと分けるという方法です。 二つ目の人気度の情報を用いる方法は、user全体からのfeedbackが少ないものでかつそのuserと共起していないものをdislikeだろうと決め打ちして、それ以外の(他のuserとはある程度共起しているがそのuserとは共起していない)itemはunknownとする方法です。 この辺りはデータセットと扱っているタスクによって色々方法がありそうです。 ## 感想とか 今回はunobservedだったものを二つの集合に分解してlossを設計していました。 feedbackの種類が複数得られる場合には、その強度でobservedの方を分けることができたりしそうです。 lossの部分も考える問題設定ごとにfeedbackの郷土の大小関係の仮定を入れることができそうなので、いろいろ使えるのでは?と感じました。 また、BPRでは複数のfeedbackを扱ったり強度がbinaryではないfeedbackの研究がありますが、WARPでそのような研究ってあるのかなという疑問を持っています。 ご存知の方がいらっしゃいましたら、コメントお待ちしております! この記事をシェアする Twitter Facebook Google+ B!はてブ Pocket Feedly コメント
コメント
コメントを投稿