Dec 13, 2004
Google Suggestをいかにパクるか
単純に補完機能を実装するだけであれば、RandomNoteのようなユーザーの検索クエリ、全文検索結果の件数を
キャッシュする機構を備えれば、わりと簡単に作れるだろう。
検索ヒストリをインクリメンタル検索するだけでいい。
これを「手法A」と呼ぼう。呼ぶことにする。
----
ユーザーの入力した語句から取ってくるのが一番楽ではあるけれど、Googleのやっていることはそれだけではない。
Google Suggestがいかにしてその語句を選び出しているのか、という
サーバーサイドの処理に関しても、もっと注目を集めていいのではないかと思う。
例えば「GoogleといえばToolbar」のような連想は、単純に検索結果が多い順ではなく、その語句に対して関連付けられた単語のうちで特徴的なものを検出し、それらをランク付けした結果だろう。
検索されたキーワードを人気キーワードのランキングとして公開する手法はかなり前からあったが、単語同士の関係性まで含めて統計として利用している点が目新しい。
----
GoogleとAmazonはデータマイニングの最先端にあって、両極だ。
両者とも大量に蓄積されたデータベースから
有用な情報を効率よく取り出すことで利益を上げているが、その方法論は全く異なる。
手法AはAmazonのA。手法GはGoogleのG。
Amazonはユーザーの行動、購入履歴から
あなたにお薦めの本を見つけ出すが、
Googleであれば、本の中身を全文検索して
あなたにお薦めの本を見つけ出すだろう、ということだ。
Amazon的な、Googleがあれば
-このリンクをクリックした人はこんなサイトも見ています。
-もっともお気に入りに追加されているサイトを上位に表示。
-この語句で検索した人は、こんな語句でも検索しています。
プライバシー云々の懸念はあるものの、手法Aを使うメリットは大きい。
莫大な計算なくしては導き出せない検索結果が徒労に過ぎず、
人に聞けば一瞬で解決してしまうようなこともあるものだ。
Edit this entry...
wikieditish message: Ready to edit this entry.
A quick preview will be rendered here when you click "Preview" button.