Feb 3, 2007

Google Tokyoの技術講演会に参加したので簡単コメント

昨日のことですがセルリアンタワーでやっていたGoogle Tokyoの技術講演会に参加してきました。まあ割と面白かったと思います。質疑時間が短すぎてちゃんと質問できなかったのでコメントがてら書いておきます。

南野さんのtalk:

  • 世界中で単一のエンジニアリングチームがすべての設計文書・ソースなどを共有していることに関して。アクセスコントロールを考慮しなくて良いことは事務的コストの削減に大いに役立つが、実際にエンジニア・インターンがsingle point of failureになり得る。NDAを結ぶから平気というのもおかしな話で、個人に負わせ得る責任にはおのずと限界があるのであって、全情報の流出による損失がそれを上回るのであれば対策が必要なのは明らかではないか。まだ流出したことがないというので今後の展開を待とう。
  • サービスの継続性に関して。短期的なゴールを定めて企業やエンジニアの行動を決めるのは結構。そんなのはどの会社でもやっている。そうではなくて長期的なサービスの継続性を実現するための具体的な方策を持っているのか。実際に現在のメールサービスが50年続くというのはもちろん冗談だが、実用的に意味のあるスパンに渡ってサービスし続けられるという確証をユーザに示す必要があると思う(エンジニアが短期的なゴールを強調すればするほど)。

Derrickさんのtalk:

  • Web検索のデータの規模が2万人のGmailのデータの規模にも満たないというのは興味深い話。メタファーで話すと、全世界の図書館にある全書籍の文字数より日々交わされる会話に費やされる文字数の累積の方が大きいのは当然のことだが、スケールとしてはなかなか掴みにくい。GmailとWebの比較は端的なインスタンスを示してもらったようなものだ。究極的にGoogleが奉仕すべき対象人数というのはいったいどれくらいなのだろうか。2000万? 2億? 20億?
  • Google Mailの検索はロジックとしてはWeb検索と違わないのかもしれないが、その性能には大いに不満が残る。いったいなぜなのだろうか。素朴に思いつくのは、メールデータではWebと違ってconversationで定義できるようなルーズなグループ構造しか存在しないためアルゴリズム的に検索精度を上げる既存の試みの一部が役に立たないことと、検索結果の解釈に関して認知科学的な要因が無視あるいは排除できないことである。後者についてもう少し述べると、ユーザの曖昧な検索要求に対して検索エンジンが与える結果がどうあれ、ユーザは自分の所有している(と信じている)メールデータに対する検索においては、(自分が所有しているわけではない)Webデータの検索に比べて、より正確で漏れがなく完全な検索結果を求める傾向があり、簡単には満足しないように思えるということである。Googleのエフォートはこうした問題を解決するのだろうか。
  • Deep searchの可能性について。例えばメッセージに含まれるURLの指し示す内容を検索対象に含めたり、メッセージの重み付けに使用したりすることが可能だと思うが、そうしたことは検討されているか。

工藤さんのtalk:

  • Bigtableの説明はかなり端折られていたせいもあってよく理解できなかった部分もあるが、要はGFS分散ファイルシステム上へのLog structured merge-tree (LSM-tree)の一実装である、という理解でよいのか。また、Bigtableの提供するrowに対する自動負荷分散機能は本当に有効なのか。通常のアプリケーションでどれくらいの不均衡が生じ得、それがこれだけ均衡化されてefficientになるんだよというevidenceを示してくれないと分からない(これは私が職業的にそう思っちゃうだけ?)。このあたりは論文を読むと分かるのかな。
  • Underlying layerのabstractionをシンプルに保つのはまったくもって賛同。んで、ハードウェア化を考えるような人材は?

私としては、もうちょっと技術的に突っ込んだ話をしてくれてもいいかなという印象でした。こうしたオープンハウス的な催しが継続されることを期待しています。

About Me

My Photo

つくばで働く研究者

Total Pageviews

Amazon

Copyright 2012 Ogawa::Buzz | Powered by Blogger
Design by Web2feel | Blogger Template by NewBloggerThemes.com