Web.2.0時代に適した日本発のオブジェクト指向言語Rubyが、バイオインフォマクティクスの世界でも急速に実績を伸ばしている。Ruby言語用のバイオ版ライブラリーである「BioRuby」(http://bioruby.org/)のGoogle検索ヒット数が、ここ1年ほどで倍増の約11万件になった。BioRubyの開発者3人のうちの1人である片山俊明・東京大学医科学研究所ヒトゲノム解析センターゲノムデータベース分野助手(写真)が、2007年2月2日にかずさアカデミアセンター(千葉県木更津市)で開かれた第1回機能ゲノミクス研究会ゲノム情報利用ワークショップ「アノテーションとWebサービス」で、BioRubyの優れた機能を説明した。

 片山助手の発表のタイトルは「KEGG APIのサービス構築とウェブサービスの普及に向けて」。片山助手らは東大医科研の金久實教授(関連記事1)の研究室に所属し、金久教授らが開発した、日本が世界に誇るデータベースの代表である「KEGG」を利用するためのウェブサービスである「KEGG API」の開発を行っている。APIは、Application Programming Interfaceの頭文字。片山助手の発表の直前に、かずさDNA研究所植物ゲノム情報の中尾光輝氏が「Kazusa API制作日誌」を発表したように、ウェブ2.0時代を迎えた現在、ウェブサービスを利用しやすくするためにAPIの開発が活発に進められている。

 KEGG APIのマニュアルでは、例として主にRuby言語を使って解説されているが、SOAPとWSDLを扱うことのできる言語(Perl、Python、Javaなど)であれば簡単にKEGG APIを利用することができるという。

 「Rubyは、簡潔でわかりやすい」と片山助手。ウェブアプリケーションを迅速に開発できるフレームワーク「Ruby on Rails」が用意されていることが大きいようだ。

 BioRubyは「配列、モチーフ、構造、パスウェイ、DB、解析ツール、ウェブサービス」をカバレッジしており、ライバルの言語に比べ、カバレッジが広いという特徴もある。Googleで検索すると、BioRubyの現在のヒット数は、約11万。ライバルの言語であるBioPythonの16.0万、BioJavaの24.6万、BioPerlの109万に比べると、ヒット数は少ないが、ここ1年でのヒット数の増大率はダントツのトップだ。片山助手が1年ほど前に調べたGoogle検索のヒット数がBioRubyは5.8万だったのに比べ、ほぼ2倍に増えた。ライバル言語の1年ほど前のヒット数はBioPythonが18.5万、BioJavaが24.3万、BioPerlが96.2万だった。ここ1年ほどでBioPythonは減少し、BioJavaは微増だったことになる。

 「バイオ関連のデータベースや解析サービスを提供するサーバーは多様で分散しており、これらを1つのサーバーに統合して提供することは困難。多数の分散したサーバーを組み合わせた解析が求められていることから、バイオインフォマティクスでは、他の分野として、ウェブサービスによるワークフローの構築が向いている」と、片山助手は指摘した。

 片山助手は、「地上最強の生物」ともいわれる“緩歩動物”クマムシのゲノム解析にも興味を持っている。「クマムシゲノムの成果を2010年にも公開できるようになれば」という。「クマムシゲノムプロジェクト」(http://kumamushi.net)の話題は、07年1月25日から配布のフリーマガジン「R25[アールニジュウゴ]」P.19にも紹介された。06年12月2日に東京大学本郷キャンパスで開催された第1回クマムシ研究会には、120人以上が参加した。クマムシのゲノムサイズは100Mb以上。乾燥すると肢を縮めて樽状になり、高温や低温、X線照射、高気圧などの極限状態を経ても、常温で水をかけると蘇生する。遺伝子データベースGenBankにはクマムシの塩基配列は7000ほどエントリーされている。

 Rubyは、筑波のまつもとゆきひろ氏が10年ちょっと前から開発している日本発の言語。頻繁に書き換えするのに適しており、「小さく、軽い」という特徴があるという。まつもと氏は1984年に筑波大学第三学群情報学類に入学し、大学在学中に2年間休学してキリスト教の宣教師として活動。93年からオブジェクト指向言語Rubyの設計・開発を行っており、97年からネットワーク応用通信研究所の特別研究員として本業でRubyを開発している。(河田孝雄)


+バイオインフォ+++