Archive for 11月 2008

プラネット・グーグル

「プラネット・グーグル」(ランダル・ストロス 著、吉田晋治 訳、NHK 出版)を読了。取材や客観的な資料を元にしてグーグルの全容を冷静に記述している。巻末にはかなりの分量の注釈があり、そこには参照データの出典が事細かに記載されているため、本文の内容も十分信頼するに足る物であることを印象づけている。なお、本書は翻訳本であるが、本年9月に日米で同時刊行とういことなので、変化の著しく早い Google の実態と本書の内容が著しく乖離しているようなことはないだろう。このような内容のものは旬である時期に読むことが大切だと思う。

Google に対する個人的なイメージは、優秀な技術者群によるテクノロジー至上主義の下で、独創的な機能を持つサービスを続けざまに成功させている、というものだったが、実際のところは失敗したサービスも多々あることがわかったし、また企業としての活動の様子がとても未成熟な会社であるという印象を持った。実情は他のベンチャーとそう大きな違いはなく、Google のキモである検索アルゴリズムの創出が屋台骨を支えている、といったところか。

Google は設立されてからちょうど十年が経過した。その昔、IT 企業について三十年周期説のようなものを聞いたことがある。大抵の IT 企業は、十年かけて成長していき、次の十年では状態を維持し、最後の十年で衰退していく、というものである。そんな話を聞いたときちょうどあの DEC が最後の十年を終えようとしていたときで、三十年周期説が妙に説得力のあるもののように感じていた。Google は次の十年でどのように変化していくのだろうか。

他のブログに倣って、最後に目次を転載しておく。

はじめに
  岐路に立つグーグル
  グーグルの広告戦略
  グーグル vs マイクロソフト(とヤフー)
  世界中の情報を整理する
  働きたい会社第一位
  HAL こそがわれわれの目標だ
開放と閉鎖 ? グーグル VS フェイスブック
  情報へのアクセスをめぐる争い
  ビジネス参入へのタイミング
  開放的なウェブを巡回するスパイダー
  AOL からフェイスブックへ
  「ソーシャル」の脅威
  「フェイスブック」問題
  広告モデルとプライバシー
  「開放性」のカードを切る
  グーグル vs ウィキペディア
限りない処理能力 ー 不可視の身体
  野望をかなえるハードウェア
  ビジネスよりも、規模の拡大
  十億ページのインデックス
  増殖するマシン
  だれもいないデータセンター
  ブラックボックス
アルゴリズム ? グーグルの頭脳
  頼りはアルゴリズムだけ
  ヤフーの失策
  七十パーセントを超えるシェア
  「MSN は風前の灯だ」
  われわれこそがアルゴリズムである
  人間の介入
  ニュース編集者の勝利
  機械翻訳ソフト・コンテストでの成果
  データは多ければ多いほど良質
  収益は望まない ? 今のところは
月ロケットの打ち上げ ? 世界図書館戦争
  世界中の書籍をデジタル化する
  先行者たちの失敗
  莫大なコストと時間
  著作権問題
  はじめての訴訟
  だれが実現すべきなのか?
  未完のプロジェクト
グーチューブ ? アルゴリズム VS 動画
  動画検索の黎明期
  後れをとったグーグル
  ユーチューブ誕生
  どん底からの急成長
  迷走するグーグル
  クリップ文化
  ユーチューブ買収
  コストのかかる試み
やっぱり世界は狭い ? ベッドルームから惑星まで
  仮想の空中旅行
  新興企業キーホール
  ドットコムブームの終焉
  グーグルによる買収
  マッシュアップ
  「わざわざ実際に世界を見る必要があるか?」
  トップレスで日光浴
  デジタル時代の公共スペース
  グーグルアースを使うテロリスト
  グーグル以外のことなら何でもググれ
プライベートな問題 ? グーグル VS マイクロソフト
  マイクロソフトの牙城を崩す
  独自のメールサービス
  文脈依存広告
  史上最大のわるふざけ
  「だれかが監視しているわけではない」
  マイクロソフトを襲った嵐
  個人情報の一元化
  グーグルの飽和点
  顧客を増やす
  犬も食わないドッグフードは作るな
  「奴らはメールを読んでいる」
アルゴリズムよ、人間との対決だ
  グーグルの弱点
  ユニバーサル検索
  アルゴリズムへの挑戦
  ソーシャル検索 vs 人間らしいアルゴリズム
  十億ドルの損害賠償
  八十?九十パーセントの識別精度
  三百年
訳者あとがき
巻末 原注

CentOS が起動不能に

一週間ほど前になるが、CentOS のカーネルがバージョンアップしていたので何も考えずにそのままアップグレードしたところ、OS そのものが起動しなくなってしまった。状況を見ると GRUB までは問題ないようだが、その後にカーネルをロードするところですぐに動きが止まってしまう。画面には何も表示されず、左上隅でカーソルが点滅を繰り返すだけになる。

調べてみると多くの利用者が同様の不具合に遭遇しているようで、CentOS 本家のサイトにバグトラック情報がすでに登録されていた。問題のバージョンは 2.6.1-92.1.17.el5.xen だが、問題なく起動できるという報告もちらほらある。幸いなことに旧版のカーネルも残っていて、GRUB のところで選択することができるので、当面は旧バージョンを使いつづけることにした。ちょっと不思議だったのが、この件について日本語の情報がまったく見つけられなかったことである。ブログ記事のひとつやふたつはあるだろうと思ったのだが検索に引っかけることができなかった。もしかしたら検索のしかたが悪かったのかもしれない。

その後、今日になってまたカーネルのバージョンアップがあり 2.6.18-92.1.18.el5xen になったので、早速入れ替えてみたところ今度は問題なく起動することができた。前述のバグトラック情報によると xen まわりに問題があったらしい。

卒研生が Web サービス構築に挑戦中

某大学の研究室で学部四年生の卒業研究の指導をお手伝いしている。その研究室が扱っている卒研テーマのうち、マッシュアップを利用した Web サービスサイトの構築をテーマに組み入れているものが幾つかあり、それらのチームに対して技術的なアドバイスを行っているのだ。一昨年度から Web サービスを意識した卒研テーマが取り上げられるようになったのだが、今年度はそれなりに実用レベルの可能性を秘めたサービスが出来上がってきた。

「旅ときらいん」は旅行ツアーを検索するサービスだが、行き先ではなくて日付を検索のプライマリ・キーワードとしている点が売りだ。普通はまず「イタリアへ行こうかな」というように行き先から旅行ツアーを探し始めることが多いだろう。しかし、急に数日間の休暇が取れてしまったようなとき、「12月4日から 3日間のツアーはあるかな」と日付をキーにしてツアーを検索したいことがある。このような状況での検索を支援するサービスだ。

「Joyべんと」はイベント情報を自由に登録・閲覧するサービスを提供する。すでに同様のサービスがいくつか存在しているが、イベントの日時情報をタイムラインという GUI で表現した点と、イベント開催地を地図に連動させている点が独自のアイデアになる。いまは季節柄、近隣の学園祭情報を中心に掲載しながら、システム構築を継続している。

この研究室は純粋な理工系学部ではなく、いわゆる学際領域を標榜しているところなので、学生たちはプログラミング技術についてはほんの少しだけ履修したに過ぎない。そのためプロジェクト開始当初はだいぶ苦労したと思うが、現在では進捗の報告を受ける度に内容が充実してきており、なかなか頼もしい限りだ。どちらのプロジェクトもまだ開発途中なのだが、最終的な仕上がりが楽しみである。ちなみにどちらのサービスも Google App Engine と @nifty TimeLine をインフラとして活用している。

SuSE から CentOS へ

実はすでに一ヶ月近く経過してしまったのだが、サーバ用途に使っていた SuSE Linux を CentOS に移行した。特に SuSE で困っていたわけではないのだが、種々の設定ファイルの配置や構造などが RedHat 系の標準的なものと微妙に異なっていたりして、これが意外に作業中のストレスとして感じてはいた。そんなとき、ソフトウェア RAID1 を構成しているドライブの一台に故障が検出されたので、この機会に CentOS への引っ越しを決めた。

新しい環境ではハードウェア RAID を使いたくて、一万円前後の安いボードを購入した。ところがインストール作業を開始してみると色々と問題が出てきたため、改めてネットで検索したところハードウェア RAID とソフトウェア RAID の間にフェイク RAID と呼ばれるものがあることを知った。そして購入した RAID ボードはまさにこのフェイク RAID のものであった。ハードウェア RAID ボードになると三万円位の価格帯になるらしいのだが、製品カタログだけではハードウェア RAID とフェイク RAID の見分けるのは困難だと思う。

フェイク RAID では OS のバージョンに合致したドライバが必要になるのだが、Linux 系のドライバは各種ディストリビュータやカーネルバージョンに対応したものが豊富にある、という状況では無さそうである。そうなると将来的に OS のバージョンアップ時にも使い続けられるのか気になるところなので、結局フェイク RAID の使用を諦めて前回同様にソフトウェア RAID を採用することにした。色々と検索してみると、フェイク RAID とソフトウェア RAID の処理パフォーマンスはそれほど変わらず、ソフトウェア RAID の CPU に対する負荷も気にするほどではなさそうなので、これで良しとする。

この機会に HDD もシリアル ATA への移行を目論んでいたため、RAID ボードの代わりにシリアル ATA ボードを追加入手しなければとあせったが、幸いなことにマザーボード(ASUS PAP800-VM)には IDE だけでなく SATA のコネクタも付いていたので助かった。ソフトウェア RAID に加えて LVM も使って、ディスク領域は次のように構成した。

物理デバイス 論理デバイス LVM パーティション 容量
/dev/sda1, /dev/sdb1 /dev/md0 /boot 100MB
/dev/sda2, /dev/sdb2 /dev/md1 LogVol00 swap 2048MB
LogVol01 / 512MB
LogVol02 /usr 10,240MB
LogVol03 /usr/local 51,200MB
LogVol04 /var 5,120MB
LogVol05 /tmp 5,120MB
LogVol06 /home 201,248MB
LogVol07 /opt 201,344MB

今回は RAID だけでなく、メモリ増設と新たにビデオカードの追加も行った。これまではオンボードのビデオコントローラを使っていたが、ビデオ用にメインメモリの一部を共有することなくすべて OS 側で利用できるようにしたかったのだ。ビデオカードは Geforce FX5200 と 128MB を搭載したものである。3D をバリバリ使うという用途ではないので安価なものを選んだが、それでも仕様を見る限り結構な機能が搭載されており、3D のデスクトップ環境でもインストールしてみようかという気にもなってしまう。

CentOS への移行は大きな問題もなく完了し、その後も順調に稼働している。SuSE ではシステム管理に YaST という GUI ベースのツールを利用できることを売りにしているようだが、CentOS も色々な管理ツールが GUI で提供されている。これらは確かに便利ではあるが、Apache や BIND などのように使い慣れているモジュールについては、GUI だと設定ファイルが具体的にどう変更されるのかわかりにくいので、なんとなく不安になり結局は設定ファイルを直接編集してしまう。また、あまりなじみのないモジュールを GUI で管理しようとすると、GUI での操作がどういう意味なのかよく分からず、こちらも結局はドキュメントを片手に設定ファイルをいじることになる。そんなわけで いまのところ GUI ツールの出番はあまりない。

本当は NAS への自動バックアップを行うスクリプトを書かなければ行けないのだが、RAID1 が問題なく動作していることを理由にサボっている。これについても早々に手を付けようと思う。

ワイヤレスゲート・ホームアンテナ

無線 LAN のアクセスポイント増設用に、以前ここにも書いたワイヤレスゲート・ホームアンテナを購入した。この機器はイー・モバイル社の携帯データ端末 D02HW を使ってインターネットに接続することに特化した製品なのだが、D02HW 接続用の USB ポートだけでなく、さらにもうひとつの USB ポートと使用方法が取扱説明書には記載されていない謎の LAN ポート 2つが装備されている。実はこの製品のベースが汎用的なルータであることが、すでに多くのブログなどで指摘されている。

添付の説明書(といっても B4 版のペラ1枚)に書かれている手順に従うと、確かにいとも簡単に D02HW を使ったアクセスポイントを設置できた。しかしそのままではクライアントからの接続方式が WEP になっており、これを変更する方法などはまったく知らされていない。さすがにこのままではどうかと思うので、“実はサーバ機能が隠されていた「ワイヤレスゲート ホームアンテナ for イー・モバイル” を参考にしながら、WEP を WPA-PSK に変更しておいた。また、前述のブログへのコメントにあった URL からベースとなっているらしい機器のドキュメントも FCC(Federal Communications Commission)のサイトから入手することができた。これに記載されている内容は、本機の admin 管理画面の内容とほぼ一致しているようだが、インターネット接続方式に HSDPA/UMTS の選択肢が本機だけに存在している。D02HW を接続するためにはこのオプションを指定することになる。

最近では宅内 LAN における増設用無線 LAN アクセスポイントとしてPLANEX 社の無線LANポケットルータFON などが安価で入手できるので、15,000円もするこの製品をわざわざ購入する必要は無いようにも思える。しかし公共の会議室などでセミナーを実施するような場合、講師や受講者用に無線 LAN 環境を提供するような用途に重宝する。実際に今回の購入もこのような使い方をしなければならない事態が発生したためである。また、普段は宅内の既存 LAN 内で通常のアクセスポイントとして活用し、メイン回線に障害が発生したときには D02HW を経由した接続に切り替えることができるので、バックアップ回線としても十分に有効である。

FCCのサイトにあったドキュメントによると、本機は D02HW との接続だけでなく、有線 LAN に接続してアクセスポイントにしたり、無線 LAN の子機にすることもできる。さらに USB ボートへ接続した HDD を Samba で共有したり、バーチャル DMZ やパケットフィルタリング設定など、もう完璧に普通のルータ機能を一通り揃えている。それなのにワイヤレスゲート社はあくまでも D02HW 専用の LAN アクセスポイント機能だけを使うデバイスとして販売している。恐らく技術サポートのコストを抑えようとしているのだろう。それは理解できるが、そうであれば少なくとも無線 LAN の暗号化方式を WEP ではなく、WPA-PSK にすべきではなかったのか。本機が WEP しかサポートしていないというならともかく、admin の設定項目として WPA-PSK が存在しているのだからなおさらのことだ。

OpenOffice.org 3.0 へのバージョンアップ

OpenOffice.org が 3.0 にバージョンアップした。公開直後はアクセスが殺到して大変だったようだが、現在は特に問題なくダウンロード出来るようになっていた。今回はどのような機能拡張があるのか、あまり知らないままアップグレードしたのだが、実際に触ってみると新しく追加された「拡張機能マネージャ」機能が面白い。これを使って Firefox のアドオンと同様に色々な機能を簡単に追加できるようになっている。公式に公開されている拡張機能は http://extensions.services.openoffice.org/ にアーカイブされていて、もうすでに多数のモジュールが登録されていた。OpenOffice.org の旧バージョンでも利用していたクリップアート集もここに収録されている。

普段使っているデスクトップ環境では OpenOffice.org ではなく StarSuite を使ってきた。StarSuite には最初から OpenOffice.org よりも豊富なクリップアートが入っているし、Sun が実施するアップデートの時期が OpenOffice.org よりも早い(日本語版だと StarSuite のほうがいつも一ヶ月位早い)、というのが StarSuite を使い続けてきた理由である。しかし、ここ数回のアップデートではなぜか Sun からのリリースのほうが遅くなるようになっていたし、新 OpenOffice.org の機能拡張方式によってクリップアートの追加はいとも簡単に行える上に、他の様々な拡張機能を追加することもできるようになった。こうなるともはや StarSuite を使い続ける理由は無い。この機会に StarSuite をすべて OpenOffice.org に置き換えるつもりだ。