2009-01-01から1年間の記事一覧

livedoor clipでクリップされてるホスト(2009年6月)

ずいぶんと時間が経ってしまったが、EDGE Datasetsの2009年6月分を頂いたので、前回の「livedoor clipでクリップされてるドメイン - 鯨飲馬食コード」と同じようなことをやってみた。というか、あまりにもノイズが多いので簡単に除去しようとした際の副産物…

LinuxでChromeメモ

LinuxでGoogle Chromeを使うときは、前回「Ubuntu 8.04でのChromiumビルドメモ - 鯨飲馬食コード」で書いたように、配布されているdebファイルをダウンロード及びインストールするか、Chromiumを自前でビルドすればよい。とはいえ、どちらの方法も気軽に試し…

Ubuntu 8.04でのChromiumビルドメモ

Chrome OSをビルドしたのだけど、OSよりもブラウザとしてのChromiumに興味が出てきたので、そちらの方のビルドメモ。単純にLinux上でChromeというかChromiumを使いたい人は、「Early Access Release Channels (The Chromium Projects)」にあるリンクからdeb…

Dual pivot quicksort(C++)

(2010-06-17 quick sortに誤りがあったので結果とコードを削除した)前回の「Dual pivot quicksort - 鯨飲馬食コード」で書いたコードをC++でテンプレートとイテレータを用いて書き直し、ソートアルゴリズムの簡単な比較を行った。比較したのは以下。 comb so…

Dual pivot quicksort

(2009-11-05追記 heap sortにバグをあったのでコードを差し替え、計測しなおした) (2009-11-06追記 heap sortのコードと結果を削除した) (2010-06-17追記 quick sortに誤りがあったので結果とコードを削除した)先日、dual pivot quicksortというソート法があ…

Tera TermからVimを使うときにBackSpaceが効かない

geditからVim派に改宗してからというもの、快適なエディタ生活を送っていたのだが、つい最近Tera Termで接続してからVimを使うと、なぜかBackSpaceキーで文字が消せないということに気付いた。カーソルは左に移動するのだが文字が消えないのだ。Ubuntu環境で…

PageRankアップデート(2009年5月)

気付いたら「鯨飲馬食コード」のPageRankが3になっていた(2009-05-30 10時ごろ Firefox版GoogleToolbar調べ)。以前「PageRankアップデート(2009年1月)」で書いたようにPageRank4は一時的なものだったようだ。今回のアップデートにより「個人ニュースサイ…

Google App EngineでRSS

PythonとGoogle App Engineの勉強を兼ねて、性懲りもなくRSSのジェネレータを作ったよ。データベースの知識がなかったのでかなり手間取ったけども。 カトゆー家断絶(RSS) ゴルゴ31(RSS) まなめはうす(RSS) 痕跡症候群(RSS) (・∀・)イイ・アクセス(RSS…

重複なしリスト

Pythonで、RubyのArray#uniqみたいにリストから重複している要素を削除する方法ってないかなと思ったのでメモ。原理的にはこういうことだよね。 #!/usr/bin/python #coding: utf-8 #for Python2.5 def uniq(ol): ul = list() s = set() for x in ol: if x no…

Web API関連(Python3.0)

前回の「Web API関連」は、正規表現を使ったところがいまいちだった。ウェブ上で探してみると、どうやらPython2.6から標準でjsonのパーサがライブラリに含まれるらしい。そこでUbuntu8.10のリポジトリに含まれていたPython3.0(rc1+)の環境で書き直してみた…

Web API関連

ちょっとPythonの勉強をし始めたので、以前Rubyで書いたWeb APIを参照するためのものをPythonで書き直してみた。 Web API関連(はてブ・はて☆スタ・livedoor reader) - 鯨飲馬食コード Web API関連(livedoor clip・PageRank) - 鯨飲馬食コード 対象は、は…

MPICHとMPI::BOOL

C++のコードをMPIを用いて並列化しようとした時の話。Ubuntu上でOpenMPIを用いてテストを行い、大丈夫そうなので実際にOpenSUSE上でMPICHを用いてコンパイルしようとするとエラーが出た。「'BOOL' is not a member of 'MPI'」と表示されるので、MPI::BOOLが…

LDAP環境下で新しいホスト名をつけた時

先日、計算機に新しいホスト名をつけたときの話。DNS(namedとかbind)にホスト名とIPの対応を記述するというのは当たり前の話。ssh でリモートからの接続も問題なく行える。しかし、なぜかログインしたときにストレージサーバにあるホームディレクトリをマ…

RubyでPPM出力のメモ

Rubyで簡単な画像を作る機会があったのでそのときのメモ。CとかJavaでのPPMファイルの作り方のドキュメントはウェブ上にたくさんあるのでそちらも参考に。PPMについては「http://en.wikipedia.org/wiki/Portable_pixmap」を参照。気づかなかったけど、Window…

テキストファイル入力のメモ

私はRubyをテキストファイルを一行ずつ入力し、処理して出力するという用途でよく使う。その時のメモ。よく使うのはIOクラスでファイルを読み込む方法。 #!/usr/bin/ruby #IO.rb in_file = ARGV.shift IO.foreach(in_file) do |line| if line =~ /^http\:\/\…

livedoor clipでクリップされてるはてなダイアリー

前回書いたように「クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)」で手に入れたlivedoor clipのデータ(2008年12月版)をドメインごとに分類するとd.hatena.ne.jpが一番多かった。そこでid別にカウントしてみた。どう…

livedoor clipでクリップされてるドメイン

「クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)」で手に入れたlivedoor clipのデータ(2008年12月版)をどう使用しようかと考えている。ソーシャルブックマークの研究という点では、レコメンデーションやリンク予測が…

Web API関連(livedoor clip・PageRank)

Web APIをRubyで参照する時のメモ。livedoor clip件数とGoogleのPageRankを取得する。 #!/usr/bin/ruby require 'xmlrpc/client' require 'net/http' Net::HTTP.version_1_2 require "rexml/document" username = "geiinbashoku2" # livedoor clip数 srv = X…

RubyでPageRankの参照

PageRankをRubyで処理したときに使ったスクリプト。使いまわしだしエラー処理してないけど。

被はてなブックマーク数の平均

「はてなダイアリーのPageRank - 鯨飲馬食コード」の結果から被はてなブックマーク数の平均を求めてみた。前回記したが、サンプルは被はてなブックマーク数のトップ500のダイアリーである。 PageRank 平均 標準偏差 最大 最小 6 22938.5 6760.5 29699 16178 …

はてなダイアリーのPageRank

前回の「個人ニュースサイトのPageRank - 鯨飲馬食コード」の連なりとして、今回はソーシャルブックマークとPageRankの相関を見てみたかったので、被はてなブックマーク数が多いはてなダイアリーのPageRankを調べてみた。対象としたのは2009年01月15日に「To…

個人ニュースサイトのPageRank

「個人ニュースサイトのURLデータセット(2008年10月) - 鯨飲馬食コード」のデータ(nstesting.txt)を入力として用いて、各サイトのPageRankを調べてみた。APIとして「TRYNT Google Pagerank Web Service // Trynt Heavy Technologies」を利用してRubyで処…

PageRankアップデート(2009年1月)

しばらく見てなかったので気づかなかったのだけど、「鯨飲馬食コード」がPageRank4になっている(2009-01-12 19時ごろ Firefox版GoogleToolbar調べ)。今時PageRankを気にする人もあまりいないのかもしれないけど、昔趣味でSEOをやってたときにも個人のサイ…