『涼宮ハルヒの憂鬱』から遠く離れて(random walk with restart)
前回のアルゴリズムを改変して、以下のようにした。
- 対象とするとする商品のASINを取得する。
- amazon web services(API)を用いて、取得したASINに対して推薦する商品を求める。
- 具体的にはSimilarityLookupを用いた。この方法では10件の商品が推薦される。
- 推薦された商品から1つ選択し(一様分布)そのASINを取得する。
- 規定ステップ数繰り返す。
- 上記を1ループとして初めから繰り返す。
前回と同じように『涼宮ハルヒの憂鬱』を対象として、ステップ数100、リスタート(ループ)回数50とした。つまり、のべ5000商品が選ばれる。これら選択された商品を種類別に回数を数えてランキングした。
単純に考えると10枝、深さ100の木構造となるので全探索空間は10の100乗の順列組み合わせとなる。その中からランダムに50のパスを選んでいるので、かなり局所的にしか選択できていない。できるだけ多くのパスを辿ることが好ましいが、時間は有限なのでこのような方法をとった。
以下にその結果を示す。ランキングは663の商品からなる。なお計測したのは2008年9月6日12時20分から14時20分(JST)の間である。
先に印象を言えば、今回もあまり「遠く」まで辿りつけなかったような気がする。だが、どれほど「遠く」へ辿りつけたのなら満足できるのかも判然としないのでなんとも。
追記
全て入りきらなかったので1回しか選択されたなかったものを削った。