『涼宮ハルヒの憂鬱』から遠く離れて
- Amazonのレコメンデーションを用いた探索(著者ベース) - 鯨飲馬食コード
- Amazonのレコメンデーションを用いた探索(『テヅカ・イズ・デッド』) - 鯨飲馬食コード
- Amazonのレコメンデーションを用いた探索(『動物化するポストモダン』) - 鯨飲馬食コード
今回も引き続き、amazonのレコメンデーションを使ってみようという試み。今回は『涼宮ハルヒの憂鬱』から始めて、どんな商品に辿りつくかを試してみる。『ハルヒ』を選んだことに深い意味はない。
簡単にアルゴリズム(もどき)を以下に記す。
- 対象とする商品のASINを取得する。
- amazon web services(API)を用いて、取得したASINに対して推薦する商品を求める。
- 具体的にはSimilarityLookupを用いた。この方法では10件の商品が推薦される。
- 推薦された商品の中から未だ選択されていないものを一つ選択し(一様分布)そのASINを取得する。
- 推薦された商品が今までに全て選択されていた場合は一つ前に戻る。
- 以下繰り返す。
- 探索の終了条件にはamazon距離を用いた。
前回までが幅優先探索だとすれば今回は深さ優先探索といったところ。遷移先の商品を未選択のものを選ぶようにしているが、これはできるだけ「遠く」へと辿りつくためである。この制約を外せばランダムウォークっぽいかもしれない。
このアルゴリズムを用いて『涼宮ハルヒの憂鬱』からamazon距離100の商品まで調べてみた。なお全探索空間が広大なため、なかなか距離100まで辿りつかないことがあった。そこで距離100に辿りつく前にバックトラックが10回を超えた時はリスタートした。
制約条件を外し、かつリスタート回数を増やして出現回数で商品をランク付けしてみようかとも考えているが今回はパス。
以下結果。あくまでも一つの例(リスタート2回)。計測したのは2009年9月5日の23時25分から30分(JST)の間。
amazon距離100でもあまり「遠く」まで来なかったような気もする。
あまり試行回数が多くないのではっきりとしたことは言えないが、ライトノベルやコミックの一般的な傾向として、同シリーズの間を彷徨うような振る舞いが見られた。また同じく、ライトノベルやコミックはそのシリーズの新しい巻から他のシリーズへと遷移する傾向が見られた。上の例でも『涼宮ハルヒの分裂』から『ゼロの使い魔 11』へと遷移し、しばらくシリーズ内を移動した後『ゼロの使い魔 14』から『灼眼のシャナS 2』へと遷移している。逆に古い巻は同じシリーズへと遷移しやすいような印象を受けた。これは購買行動を考えれば自然な帰結といえるだろう。
以下に上のデータを取得してから何回か試行した中で一番「遠く」まで来たような印象を受けた例を挙げる。
ASINで単一化しているので重複しているように見える商品もある。『D-Sides』と『D-Sides』とか。
個人的には『Zombies Vs. Robots Vs. Amazons』がすごく気になるんだけど。これってどんな本(コミック?)なんだろ。