クラウドコンピューティング


クラウドの活用はアドソル日進へ

クラウドとOSSを組合せたシステム構築


クラウドコンピューティング

特徴

  • IaaS(Infrastructure as a Service)の活用
  • Hadoopの利用

概要

クラウド技術と既存オープンソースを組み合わせたシステム構築


IaaSを活用した分散開発プラットホーム

使用情報

分散開発プラットホームを構築・運用していくには、様々な課題があります。

AmazonEC2とS3を利用することで以下の課題を解決しています。

・終了したプロジェクトも、後になって参照することがあるので削除できず、容量が増え続ける
・プロジェクト数、プロジェクトに参加する人数が急激に増加する場合がある
・災害や火事でサーバルームが倒壊したとしても、プロジェクトが継続できなければならない

それぞれの課題をIaaSを使って解決
  • 終了したプロジェクトも、後になって参照することがあるので削除できず、容量が増え続ける

    • 従来の方式であれば、数年後を見越して最初から想定される最大容量のストレージを導入しておく必要がありましたが、IaaSであれば実際に使用したストレージの容量に応じた料金を払うだけで済むので、必要に応じて容量を追加することができます。
  • プロジェクト数、プロジェクトに参加する人数が急激に増加する場合がある
    • プロジェクトのピーク時には人数が増え、参照する頻度も上がるので、サーバに対する負荷が急激に増えます。負荷が高くなればIaaS上のインスタンスを追加し、プロジェクト単位で分離することで、負荷を分散させることができます。
  • 災害や火事でサーバルームが倒壊したとしても、プロジェクトが継続できなければならない
    • バックアップの保存先としてAmazonの別データセンターを使用することで、特別な追加投資なしにディザスタリカバリを行い、業務継続性を確保しています。

クラウドコンピューティング

Hadoopによる文章検索システム

Hadoopを利用して社内向けの文章検索システムを構築しました。社内で非常に多く使われているMS-Office文章やPDF文章を効率的に検索するために、事前クローリングによりテキスト抽出を行い、インデックスを作成します。
検索システムにより社内文章の再利用を促進するとともに、いち早くHadoopを使ったシステムの本番運用を行い、Hadoopに関するノウハウの蓄積に取り組んでいます。

Hadoopを使うメリット
・ Hadoopにより数多くの文章を扱える
– 分散処理のスケジューリング、失敗時のリトライをHadoopが自動的に行うため、大量文章に対するクローリングを容易に行うことができます。
・ テキスト抽出、サムネイル作成、検索エンジンには既存のものを活用
– テキスト抽出にPOI、サムネイル作成にOpenOffice、検索エンジンにSolr、と既存のミドルウエアをうまく活用することで、効率的な開発を実現しました。
特にHadoopはJavaベースなので、Javaのライブラリを容易に組み込むことができます。

クラウドコンピューティング

キーワード
, , , , , , ,