Posts tagged ‘Amazon EC2’

Amazon Elastic MapReduce というサービス

Amazon が Elastic MapReduce というサービスをリリースした。これは Google の中核を形成する大規模分散並列計算システムを模したもので、オープンソースの Hadoop によりサービスが提供されている。Hadoop は Apache Hadoop プロジェクトにより公開されているオープンソースソフトウェアで、Google が発表した MapReduce に関する技術論文に基づいて実装されたものだ。この MapReduce が EC2 や S3 と同様の価格体系で利用することができる。かなり画期的なことなので、開発関係者などの間ではしばらく話題になると思う。このようなサービスが普及するほど、既存のデータセンターあたりは厳しい状況になるだろうと素人は考えるのだが、そういった筋からの噂によると、それほど危機感を持っていないらしい。セキュリティだとか会社の信用といった面で、まだ自分たちのほうが優位にいると考えているらしい。本当にそうなのだろうか。

Amazon EC2/S3 の使用感

Amazon EC2/S3 を使ってみた雑感をまとめておく。今回は何らかのシステムを作るための開発環境として利用することを想定した。AMI には Amazon が提供している fedora8 を導入してから、必要なパッケージなどを追加した。Python と Django はソースコードからインストールしている。

AMI の導入はそれほど難しいわけではないが、慣れるまで手順が煩雑に感じた。導入の手順については多くの先駆者達が貴重な情報をブログなどで提供してくれている。これらにはずいぶんとお世話になった。感謝。一方、Amazon の公式ドキュメント“Getting Started Guide”, “Developer Guide”)もしっかりとしているので、導入作業を実施するときは、公式ドキュメントをメインのテキストにしながら、Web からの情報をサブテキストとして使うようにするのが早道だと思う。

AMI は Amazon が公式に提供しているものに加えて、コミュニティベースで配布されるものが多数ある。しかし、自分の目的に合ったものを探すのは困難である。仮に適当なものを見つけたとしても、出所が分からないとセキュリティなどの面からも不安が拭えない。結局、RedHat のような有償のものを利用するか、自分の手で AMI そのものも作ってしまうのが良いと感じた。AMI の作り方は前述の公式ドキュメントにも記載されている。今回は AMI の自作までは試みていないが、次の機会にはぜひとも挑戦したい。

サーバへの接続作業は ssh 端末を介して行ったが、キー入力に対するレスポンスがややもったりとした印象だった。もっともリモート環境へのアクセスとしてはこんなものだろう。今回はサービス提供用の公開サーバではなく、開発環境として使うことを想定して試用した。そのため毎日インスタンスの開始と終了を繰り返すことになる。当然、終了時には必ずイメージを S3 にバックアップすることになる。しかもバックアップ後には必ず AMI の再登録作業が必要になる。こういった一連の操作が意外と手間で時間も掛かった。これらの作業はスクリプトを書けばもう少し自動化できると思うが、それでも開発環境として常用するかどうかは判断に迷うところだ。また、終日運用を前提とする公開用のサーバ環境として使えるかどうかは、この試用の結果だけからは判断できない。ただ、サーバマシンとしては通常のものと同じように使えていたので、公開サービスに対する負荷にどこまで耐えられるのか、といったあたりが導入判断のポイントになるのだろう。

参考:
Python のアップグレードに伴う問題
Amazon EC2 の ec2-upload-bundle と ec2-register
Django の開発用 Web サーバを Amazon EC2 で動かす
Amazon EC2 で ec2-regist を忘れる