Oct 2, 2006

ローカル検索におけるオーソリティ

ここギコ!: Googleローカルはやっぱり純粋な意味でのサーチエンジンではないと思う

長めのコメントを書こうと思ったがいかにも冗長にすぎたのでここに私の感じていることをまとめておく。

Googleローカルはやっぱり純粋な意味でのサーチエンジンではないと思う

と言われればその通りで、ローカル検索はWebページ集合に対する純粋なサーチエンジンにはなり得ないのではないか。

というのも、Web検索の場合には検索対象となる実体がネット上に完全な形で存在するのに対して、ローカル検索の場合にはそういうものが存在しないか、類似したもの(実体に対応すると考えられるURL)は存在するかもしれないけれど現実と乖離している可能性がある、という差異があるからだ。

ナイーブに考えるなら、ネット上の住所情報の生起をハイパーリンクの生起と同様にみなしてpagerankを計算して云々ということは可能だ。現状ハイパーリンクに比べて住所情報の生起回数の方が圧倒的に少ない(例えばこのブログに登場する住所情報とハイパーリンクの比を考えてみればよい)ために、容易にexploit可能な状況にあるという技術的な問題は別途あり得るが。

しかし問題は、ローカル検索では、ネット上には存在するが現実には存在しない事象や誤った事象や無視可能な事象などの情報は排除されるべきだとか、住所以外のプロパティ(ジャンル・時刻・料金・人数・アクセス手段・ドレスコードなど)がより重要だとかとかいった、Web検索とは別の、現実世界とのマッピングや利用者側のニーズを実現するようなrankingが求められるということだろう。

これらの問題のうち前者(現実世界とのマッピング)は、結局のところ「オーソリティ」の実現方法の問題だと言い換えられると思う*1。Webページ集合の場合には集合自体がオーソリティたり得たが、ローカル検索の場合にはそうとは言えない。

例えば「ソニーを代表するページ」のURLは「ソニー」が実在の企業であるかどうかに関わらずまた「外部」オーソリティに拠らず、ページ集合から計算で求め得る。一般にWeb検索のように対象となる実体がネット上にのみ存在する場合には、オーソリティはネット上に見出すことができる。Web検索においてそのオーソリティを代理行使する者が「神」として振る舞える道理だ。

これに対して「五反田ジローナ」が確かに実在することは外部オーソリティなしには証明できない。もしそういうものがなければ「Web上で一応存在すると仮定される五反田ジローナ」に対応するURLやその地図上の場所を決定できるに過ぎない。ではその(Web上で一応存在すると仮定される)「確からしさ」とは、どの程度実体に照らして確からしいのか?

一見十分に確からしいような気もする。というより、近年その確からしさを過信する傾向が続いてきたせいもあってそのように考える人が増えてきた。メジャーな飲食店のレビューサイトは、一般にinbound linkをたくさん有しているのでpagerank上「オーソリティ」たり得ていて、その情報の多くは正しい店舗情報を与えるので「確からしい」。あまりの「確からしさ」にレビューの内容が信頼おけるものと信じてしまう人までいるくらいだ、と(そんな確からしさは幻想に過ぎないのではないか?)。別の例を考えてもよい。多数の人がある店舗に関するブログ記事を書いたとする。一部には不正確な情報があるかもしれないが集合知としてはより実体に近づけるはずだから「確からしさ」は実用的な水準以上に維持できる、と(少数しか言及されない店舗の情報は不正確な状態に放置されるのではないか?)。

しかし、その情報の正確さについて誰も何の保証もしていない以上「確からしさ」には限度がある。特に住所や緯度・経度のIDとしての確実さ・正確さと比べればもう間違いなく圧倒的に劣っている。このことはもっと重視されるべきである。地図画像は正確無比に描けてもそれに付与される情報が誤っていては何の意味もない。

私は、ローカル検索の課題というのは、結局のところ両者のギャップを埋めることで、そのために「いまだ存在しないオーソリティ」を発見・実現すること(GoogleがWeb検索において発見したように)なのではないかと思っている*2。その一つの解が、Googleローカルが採用している、ゼンリンデータだかインターネットタウンページだかの外部オーソリティに依存する方法や、一部レビューサイト*3を仮想的なオーソリティとみなす方法だろう。言うまでもなくこれらの方法にも改善の余地はあるのだが、しかし重要なのは部分的にせよ解になっているということだ。また一方でDMOZを見れば明らかなように、ナイーブにオンラインディレクトリを運営すれば解決するような問題でもなさそうだ。

この課題にどのような決着がつくのかとても興味深い。


*1 後者はセマンティックWebの問題。
*2 もちろん、それなしでも何らかのアプリケーションを実現することはできるだろう。できるだろうが、それがローカル検索の目的ではないのではないか、というのが私の観測。
*3 今のところ、飲食店情報では食べログ.comぐるなびを参照しているようだ。

About Me

My Photo

つくばで働く研究者

Total Pageviews

Amazon

Copyright 2012 Ogawa::Buzz | Powered by Blogger
Design by Web2feel | Blogger Template by NewBloggerThemes.com