第3回Twitter研究会の発表資料
28日の第3回Twitter研究会で、Crowsnestについて発表してきました。スタッフと参加者の皆様、ありがとうございました。
情報発見の手段が検索からソーシャルへ変わってきているというのは良く言われることですが、実際にCrowsnestを開発してみた感覚として、技術的に検索エンジンとCrowsnestを対比するのが面白そうだと思い、そうした観点でプレゼンを作ってみました。
ソーシャル・ニュースリーダー「Crowsnest」におけるTwitterのリアルタイム解析と情報整理の未来
資料中にもありますが、Crowsnestの構造は以下のように捉えることができます。
検索エンジン | Crowsnest | |
---|---|---|
ページの発見 | ハイパーリンク | ツイート |
転置インデックスのキー | 形態素 | 言及者 |
クエリ | キーワード | ユーザの持つソーシャルグラフ |
結果のソート | PageRankなど | 言及者の信頼度 |
枠組みには検索エンジンとの共通点が多いですが、ハイパーリンクやキーワードの部分が「人」に置き換わっています。この中で、個人的に興味深いと思っているのは転置インデックスの部分です。従来の検索エンジンでは、文書をインデックスする時点でキー(文書が含む形態素の一覧)が確定していますが、CrowsnestではユーザがURLをツイートするごとに、キー(文書への言及者)が動的に追加されていきます。つまり、情報の価値は情報自身にあるのではなく、その伝播者がもたらすという考えが、ここに強く反映されていると思います*1。