ホーム > IIJ Technical WEEK 2012 ポスターセッション トップ > クラウドコンピューティングへの取組

クラウドコンピューティングへの取組

クラウドコンピューティング

インターネットは、情報化社会における「人間とコンピュータの共生」という、半世紀程前に提示された野心的なビジョンに挑戦する地球規模での取り組みでした。そして現在では世界中の様々なコンピュータシステムが情報を交換する巨大な通信インフラへと発展しました。今日のインターネットをビジョン実現の第一段階と位置付けるならば、現在クラウドコンピューティングと呼称されている「ネットワーク化された大量のコンピュータシステムによる大規模情報処理インフラ」への挑戦は第二段階の発展の方向性であると考えられます。IIJ-IIでは人間とコンピュータの共生というビジョンを実現する研究開発を実施します。

Gryfon (グリフォン)

IIJ-IIでは新たなクラウドコンピューティング・プラットフォームとしてGryfonの研究開発を進めています。Gryfonは多数のノードを結合可能な構造を持つ、大容量データの分散並列処理をスケーラブルに実現可能なクラウド環境です。それぞれのノードは自律的にクラウドへの追加・削除が可能なため、クラウド全体での高い冗長性、拡張性を実現します。

Cloudbusting Machine(CBM)

Gryfon は2010年よりクラウド・アプリケーション向けプラットホームの開発を続けており、その成果の一部を Cloudbusting Machine (CBM) として公開してます。

パイロットシステム

現在これまでの開発成果の集約作業を進めています。「パイロットシステム」と呼ばれるこのシステムはビッグデータ処理を支援する次のようなコンポーネントから構成されます。 パイロットシステム全体は小規模な検索システムとして機能することを目標としており、現時点では Wikipedia のページデータを利用して各種情報の抽出・集計などテキストマイニング系のアルゴリズムの実装を試みています。これは CBM のビッグデータ処理向けプラットホームとしての側面を強化することに役立ちます。

ビッグデータ処理への対応

「ビッグデータ処理」はクラウドコンピューティングならではの技術課題として昨今注目を集めています。CBM をビッグデータ処理向けのプラットホームとして拡充するに当たり、ビッグデータ処理プラットホームの課題を把握するため、私たちはWikipediaのデータに着目しました。

Wikipediaデータの活用

現在、典型的なクラウドアプリケーションの事例としてWikipediaデータを対象にしたテキストマイニング手法の適用を試みています。例えば、Wikipediaデータから形態素解析システム向け辞書の自動生成などが上げられます。

その結果ビッグデータを対象にしたデータ解析手法をソフトウェアの実行はそれほど大きなコンピュータリソースを使用せず、現実的なパフォーマンスを得ることができるものの、その前提となるデータベース構築には非常に多くのコストを必要とすることがわかってきました。

このようなビッグデータ処理を効率よく実行できるプラットホームとするべく、パイロットシステムの機能強化を進めています。

ページトップへ