最近、「ディープラーニング」というキーワードを覚え、バイオインフォマティクスに関連する取材の際に多用しています。

 人工知能が「経験(=学習用のデータ)」をもとにルールを学習する際、脳の機能を参考にして作られたニューラルネットワークを活用するのですが、経験をより多層的にとらえて学習することをディープラーニングと呼んでいるようです。

 分かりやすい例えとしてよく画像認識の例が示されるようですが、人工知能が「ある画像のある位置に赤いドットがあるならば、画像が消防車である確率は何%」とシンプルに学習する方法ではなく、「画像中の赤いドットの割合がどれだけあり、画像の下の方に黒くて丸いものがあり、全体的に四角い形をしているならば、画像が消防車である確率は何%」という多層的な学習を行うことにより、さまざまな問題に対し、人工知能が独自の回答を出すようになるもの、と理解しました。あまり詳しくないので、正確ではないかもしれませんが。

 従来の機械学習では、機械が学習する際、学ぶべきポイントを人間が教えていたそうです。塾の先生が生徒に「この辺が試験に出るよ」と教えるイメージでしょうか。

 しかし、最近の機械学習では、ディープラーニングにより機械が何を学ぶのかを決めて独自の判断基準を持つ、というものだそうです。勉強の仕方を覚えた生徒が自らさまざまなことを学んでいく、というイメージでしょうか。

 こうした機械学習のメリットは、人間が気がつかない新しい事実、視点を教えてくれることです。我々人間は、膨大な量の情報に接したとき、見たいもの、理解できるものにのみ注意を払うようです。ここでいう見たいもの、理解できるものとは、これまでの経験則や教科書により培われた知見を根拠にするのでしょう。

 一方、そういう過去の蓄積に囚われずに学んだ機械は、人間が出す回答とは異なる新しい回答を示してくれるという期待があると聞きます。

 さて、omicsと呼んで膨大な情報を蓄積した我々はそこから何を見出すのでしょうか。京都大学CiRAの渡辺亮氏は、研究にもトレンドや流行があり、それはバイアスと言ってもよい、と指摘されています。PubMedには膨大な情報が蓄積しており、こうした情報とゲノム情報をマッチングさせると、よく研究されている部分のアノテーションは進むけれども、あまり研究されていない部分のアノテーションは進まないことになります。

 これまでの進歩は、人間がひらめいて、あるいは考えに考え抜いて達成してきたことです。でも、これからは機械もライバルです。機械に負けないぐらい深く考える必要がありそうです。

                         日経バイオテク 加藤勇治