TopHatenarの部門別ランキング集計基準

TopHatenar部門別トップユーザー一覧 - (旧姓)タケルンバ卿日記避難所

id:takerunbaさんが、TopHatenarでの部門別1位ユーザの一覧をまとめてくれています。お疲れ様です。

このリストを見て、「何でこの人が無冠なの?」とか、部門によっては「何でこの人が1位じゃないの?」と疑問を持った方もいると思うので、部門別ランキングの集計基準を書いておきます(11/12現在)。

まず、部門名=はてなブックマークのタグ名です。ダイアリー内のエントリーに付けられたブックマークタグの集計数が、ランキングの指数になります。

このタグを集計するとき、はてなダイアリー内の全ブックマークを収集できれば理想的なんですが、前回書いたように、そうはなっていません。

TopHatenarのサーバ資源には限りがあるので、実際には3段階のフィルタリングを行っています。

条件1

総ブックマーク数が20以上のユーザを収集対象とします。

条件2

以下のエントリーを収集対象とします。

TopHatenarが収集を始めたのは比較的最近なので、過去の注目エントリーまでは拾えていません。つまり、相対的に新興ユーザが有利になっています。

条件3

1つのエントリーにつき、3回以上使用されているタグのみ集計します。

例えば、5usersのエントリーがあって「仕事」タグが2回使われていても、そのエントリーに関しては、「仕事」タグはカウント対象になりません。

この結果、ブックマークをじわじわ集めるタイプのユーザよりも、ホッテントリをボコボコ放つユーザの方が相対的に有利になっています。

以上のように、集計基準によってある程度のバイアスがかかっていることを踏まえて、部門別ランキングを見ていただければ嬉しいです。