はてなアンテナの登録数ランキング(個人ニュースサイト篇)
「はてなアンテナから見る個人ニュース系サイトリンク集 - 白い戯言」とか「はてなアンテナから見る個人サイトリンク集2007年秋Ver. - 白い戯言」や「はてなアンテナから見る個人サイトリンク集2007年秋Ver. 順位編 - 白い戯言」を見て、面白そうだから私もやってみることにした。
対象としたサイト
先の記事と同様に「Parallels2」のリンク726をベースとし、次の操作を行った。
- HTTPステータスコード200を返したURIを対象に含めた
- HTTPステータスコード301及び302を返したURIはレスポンスのLocationのURIを用いた
- その他のHTTPステータスコードを返したURI及びタイムアウトしたURIは対象から外した。
この操作を2008年7月6日の11時55分から12時10分(JST)の間に行った。その結果、対象とするURIの数は689であった。
なお、上の操作ではリンク切れを完全にはチェックすることはできない。これに関しては後述する。
はてなアンテナ登録数で個人ニュースサイトをランキング
上記の操作によって得られたURIを、はてなアンテナ登録数が多い順でランキングした。はてなアンテナ登録数を取得したのは2008年7月6日の12時15分から12時30分(JST)の間である。なお、はてなアンテナに登録されていないサイトはランキングから除外した。その結果、649のURIでランキングは構成される。
今後の課題
やはり一番の問題はリンク切れである。この問題は人手による確認によって回避できると考えられる。
二つ目の問題は、ニュースサイトとURIの対応関係の曖昧性である。例えば「情報屋さん。」のURIを今回は「http://jyouhouya3.sakura.ne.jp/」とした。しかし、実際にはサイトは移転しており「http://jyouhouya3.net/」が新しいURIとなっている。また、古いサイトは「http://jyouhouya3.sakura.ne.jp/index.html」でも登録されている。以下にそれぞれのアンテナ登録数を括弧の中に記す。
- http://jyouhouya3.sakura.ne.jp/ (406)
- http://jyouhouya3.net/ (190)
- http://jyouhouya3.sakura.ne.jp/index.html (230)
これら二つの問題点から、やはり人手によるリンクの確認が必要だと考えられる。というわけで、そのうち何とかする予定。