第3回Twitter研究会の発表資料

28日の第3回Twitter研究会で、Crowsnestについて発表してきました。スタッフと参加者の皆様、ありがとうございました。

情報発見の手段が検索からソーシャルへ変わってきているというのは良く言われることですが、実際にCrowsnestを開発してみた感覚として、技術的に検索エンジンとCrowsnestを対比するのが面白そうだと思い、そうした観点でプレゼンを作ってみました。

ソーシャル・ニュースリーダー「Crowsnest」におけるTwitterのリアルタイム解析と情報整理の未来

資料中にもありますが、Crowsnestの構造は以下のように捉えることができます。

検索エンジンCrowsnest
ページの発見ハイパーリンクツイート
転置インデックスのキー形態素言及者
クエリキーワードユーザの持つソーシャルグラフ
結果のソートPageRankなど言及者の信頼度

枠組みには検索エンジンとの共通点が多いですが、ハイパーリンクやキーワードの部分が「人」に置き換わっています。この中で、個人的に興味深いと思っているのは転置インデックスの部分です。従来の検索エンジンでは、文書をインデックスする時点でキー(文書が含む形態素の一覧)が確定していますが、CrowsnestではユーザがURLをツイートするごとに、キー(文書への言及者)が動的に追加されていきます。つまり、情報の価値は情報自身にあるのではなく、その伝播者がもたらすという考えが、ここに強く反映されていると思います*1

*1:PageRankでも、他者からのリンクがページに価値を与えるので、この考えに近いところがありますが。