スポンサードセッション


10月30日(金) 13:30-15:30 第3会場

生命科学におけるインフォマティクスと物理化学の融合
-バイオインフォマティクスを広い視点から鳥瞰するー

【主旨】
計測技術の急激な進展は、分子から細胞に至る生命ビッグデータを私たちにもたらし、より広い視点から生命を捉える必要性を私たちに訴えかけています。ここ では、物理化学、システム科学、そして情報科学の視点から最近の研究動向を明らかにし、それら諸学問が相互に連携し、これからのバイオインフォマティクス が進むべき道について議論できればと願っています。

【プログラム】

座長
江口至洋(理化学研究所HPCI計算生命科学推進プログラム)

杉田有治(理化学研究所 杉田理論分子科学研究室)
「細胞内環境での蛋白質の分子運動と機能」

要旨 真空中の蛋白質の分子動力学シミュレーションが初めて行われてから約40年が経ち、これまでに非常に多くの計算が行われた。現在の主流は希薄溶液中の1蛋 白質に関するシミュレーションであり、蛋白質の構造とダイナミクス、そして機能との関係を調べることが主な目的である。創薬応用の観点からは蛋白質と薬剤 候補化合物の結合強度を予測するための自由エネルギー計算も重要である。しかし、細胞内における生体高分子の濃度は300-450g/Lであり、 25-45%の体積を占めており、従来の分子動力学計算で対象としている希薄溶液中とは大きく異なる環境である。我々は、1億原子を超える分子混雑系を 様々な実験データを用いて構築し、スーパーコンピュータ「京」を用いて全原子分子動力学計算を行ってきた。本セッションではこの大規模計算で用いたソフト ウェアと得られた計算結果について紹介する。
高橋恒一(理化学研究所 生命システム研究センター)
「上皮成長因子応答経路の1分子粒度シミュレーション」

要旨 上皮成長因子応答経路は増殖や分化などの細胞運命を制御するMAPKであるERKの活性化を引き起こす信号伝達経路のうち主要なものの1つである。共焦点 顕微鏡を用いてEGFPで蛍光標識されたERK分子の核移行を観察すると、遺伝的に同一な細胞群に全く同一の条件で増殖因子刺激を与えても、因子の濃度に よっては細胞間で応答のばらつき(応答不均一性)が生じる場合がある。本研究では「京」を用いて分子混雑などの細胞環境を考慮した1分子粒度シミュレー ションを実行し、ERKの応答不均一性を再現する事に成功した。また、その発生機序が特定のタンパク分子の外因的ノイズと関連する事を示唆する結果を得 た。さらに、このシミュレーション結果を利用して、機械学習により遺伝子の発現レベルから確率的な細胞応答の事前予測が可能である事を示唆する結果を得 た。
宮野 悟(東京大学医科学研究所 ヒトゲノム解析センター)
「「京」、及びポスト「京」がブーストするがんビッグデータ解析」

要旨 がんを理解するためのゲノムをはじめとする多様なデータの急激な増大への挑戦は、スーパーコンピュータを活用したがん研究に新たな領域を創造している。が んのシステム異常の理解や様々な予測のための数理的方法論が導入され有効性を発揮している。本発表では、ヒトゲノム解析センタースーパーコンピュータや 「京」コンピュータを使い、予後の良・不良などの裏にある個々人のがんの遺伝子ネットワークの特徴の俯瞰、がんビッグデータを用いた薬剤感受性・耐性を支 配している遺伝子ネットワークの構造の相違、がん融合遺伝子の網羅的解析などについて報告する。また、「安く・速く・正確に」を実現し、やがて100ドル ゲノムの時代もやってくる。誰もが自分のゲノムデータにアクセスできる時代が到来し、ゲノムビッグデータが誕生する。そのなかで、ゲノム医科学において は、ゲノムデータの臨床翻訳と解釈が最も重要な課題の一つとして世界中で取り組みが始まっている。個々人のゲノムデータを医療・創薬へと翻訳するために ビッグデータの活用が考えられ、百万人規模のゲノムや関連するデータのシェアリング体制の構築が始まった。ビッグデータの解析と利用には、IBM Watsonが、Memorial Sloan-Kettering Cancer Center, Mount Sinai, MD Anderson Cancer Centerなど十数カ所に既に導入され動き出している。東大医科学研究所にもIBM Watson Genomic Analyticsが2015年7月に導入され、がんの臨床研究などに応用され始めた。その様子などについても報告する。

HPCIホームページ


10月30日(金) 15:45-17:15 第4会場

並列配列相同性検索プログラム「GHOST-MP」講習会

講師:秋山 泰, 石田 貴士, 角田 将典(東京工業大学)(敬称略)
主催:HPCI戦略プログラム分野1「予測する生命科学・医療および創薬基盤」
人材養成プログラム(産総研 創薬基盤研究部門)
共催:HPCI戦略プログラム分野1「予測する生命科学・医療および創薬基盤」

概要 次世代シークエンサーが普及し、誰でも短時間で大量の配列データが得られるようになった昨今、データ解析におけるスピードもまた研究における重要なポイントとなっています。
「GHOST- MP」は、配列相同性検索を高速に行うGHOSTXアルゴリズムを分散メモリシステム向けに並列化したソフトウェアです。次世代シークエンサー等で得られ た大量の短い塩基配列またはアミノ酸配列を入力として、アミノ酸配列データベースに対する相同性検索を短時間で実行でき、特に大量の配列データを扱うメタ ゲノム解析などの用途に適します。

本講習会では、GHOST-MPのしくみと利用方法を説明し、メタゲノムデータ解析を例に、スパコン「京」と互換性が高い理化学研究所の SCLS計算機システムを用いたGHOST-MP実習や、ウェブサイトを利用したその結果のさらなる解析方法などを実習します。

[受講申込] HPCI 申込ページ
*聴講・ウェブ実習のみの当日参加も可能です。


10月31日(土) 10:00-11:30 第1会場
<一般公開>本セッションは一般の方も無料で参加可能です。申込みは下記よりお願いします。
[受講申込] http://urban-ii.or.jp/events/detail.php?event_id=129

ポスト京が拓く創薬と医療の新展開

座長:大阪大学大学院情報科学研究科教授 松田秀雄
司会:バイオグリッドセンター関西事務局長 志水隆一

10:00-10:30 「ポスト京によるスパコン創薬の未来」
京都大学大学院医学研究科臨床システム腫瘍学教授 奥野恭史

要旨 2020年の本格運用を目指し、次世代のスーパーコンピュータであるポスト「京」の開発が始まった。演者は、9つの重点課題の一つである創薬分野「生体分 子システムの機能制御による革新的創薬基盤の構築」の代表研究者として、次世代の創薬計算技術の開発を担当している。ポスト「京」において我々が目指すと ころは、生体分子の動きをシミュレーションする計算(分子動力学計算)の速度を「京」の数十倍程度の速さにすることによって、生体内分子(タンパク質な ど)の長時間(ミリ秒レベル)の動きを捉え、さらに多くの生体内分子を対象にした創薬シミュレーションを実現することである。これにより、疾患の原因タン パク質の動的制御や複数の創薬関連タンパク質を加味したドラッグデザインの新しい方法を開発する。具体的には、ポスト「京」の演算能力を最大限に活かす分 子シミュレーション技術を開発することで、生体分子システムの時間的空間的機能解析を実現する新たな構造生命科学の開拓と次世代創薬計算技術の開発を目指 す。さらには、これらの要素計算技術を創薬計算フローに沿って連結した統合システムを開発することで、高精度かつ超高速の革新的な創薬計算基盤の確立を目 指す。本講演では、我々が取り組んで来たスパコン「京」の創薬応用事例とともに、2020年に始動するポスト「京」で目指す計算創薬の未来について紹介し たい。
10:30-11:00 「機械学習による創薬研究の加速」
東京大学大学院新領域創成科学研究科メディカル情報生命専攻教授 津田宏治

要旨 サポートベクターマシンなどの機械学習手法を用いたバーチャルスクリーニングは、データベースから創薬候補化合物を発見するために一般的に用いられる。し かし、バーチャルスクリーニングによる予測値は、あくまで予測にすぎないため、MDシミュレーションや、ウエットラボにおける実験で検証される必要があ る。検証にかけられる予算は限られていることから、多数ある候補に優先順位をつけて実験を行い、できるだけ早い段階で、最高の化合物を発見できることが望 ましい。近年、機械学習分野で注目されている、ベイズ最適化と呼ばれる実験計画法では、候補化合物のスコアリングによって、次の実験対象を決めるフェーズ と、そこで生まれた実験結果を用いて予測モデルを更新するフェーズを交互に繰り返すことによって、ある評価関数に関して最高の化合物を最小コストで探し出 すことができる。本講演では、現在開発中の大規模データに対応したベイズ最適化法について述べ、その創薬研究への応用可能性を展望する。
11:00-11:30 「京」によるがんの進化シミュレーションとポスト「京」に向けての展開
東京大学医科学研究所ヘルスインテリジェンスセンター健康医療計算科学分野助教 新井田厚司

要旨 がんは進化の過程で異なる変異を持つ多様なクローンが生み出されると考えられている。演者は九大別府病院との共同研究で一人の患者からの大腸がんの複数の 部位から得たDNAをexome sequencingすることにより大腸がんにこのような腫瘍内不均一性が存在するのを見出した。演者は腫瘍内不均一性の生成原理を探索するために、がん の進化シミュレーションモデル、Branching evolutionary Process (BEP) Modelを構築した。更にスーパーコンピュータ「京」を利用して膨大な組み合わせのパラメーターセットでがんの進化シミュレーションを行うことにより、 実験データと同様の高い腫瘍内不均一性が生み出される条件の網羅的探索をおこなった。その結果、高い遺伝子変異率、がん幹細胞の存在を仮定すると高い腫瘍 内不均一性が再現できることを見出した。更にシミュレーション結果から細胞の増殖に寄与するドライバー遺伝子は進化の初期に獲得され全てのがん細胞に共有 されている一方で、不均一性を生み出している変異の大部分は細胞の増殖速度に影響を与えない中立変異であることが示唆された。以上、本研究により腫瘍内不 均一性を生み出している進化原理の一端がスーパーコンピュータを用いたがんの進化シミュレーションにより明らかにされた。本講演では更にスーパーコン ピュータを用いたがんの進化解析の今後の展開についても議論する。


10月31日(土) 15:00-17:30 第1会場
<一般公開>本セッションは一般の方も無料で参加可能です。

生命科学データベースと人工知能・ロボティクスの拓く未来

片山俊明(DBCLS)
五斗進(京大)

概要 実験技術の大きな発展とロボットによる自動化により、これまで以上に網羅性・均質性の高い大規模データが蓄積する可能性が見えてきた。同時に、計算機の技 術も発展し、これらのビッグデータを応用するデータサイエンスの時代に突入してきた。特に人工知能の分野ではデープラーニングを始めとする技術の開発と、 画像認識技術などへの実用化も進んできている。新型シーケンサーやロボット実験などから生み出されるバイオビッグデータを活用し、生命科学研究を推進する ために、これらの新しい情報技術の応用が求められている。そこでは、次世代の生命科学データベースを元に、仮説を生成し、ロボットによる実験を行い、さら に人工知能の支援によって結果を解釈し、新たな知識をデータベースに還流するというサイクルが期待されている。
しかしながら、人工知能分野やロボティクス分野の研究者と生命科学研究者の接点はまだそれほどないのが現状であり、生命科学データベースにおけるその将来 性はまだ未知数である。本セッションでは、人工知能分野やロボティクス分野の研究者とバイオインフォマティクス分野でビッグデータ解析や人工知能研究に携 わる研究者に、ご自身の経験と今後の連携に期待する提言を含んだ内容をプレゼンテーションしてもらい、今後のビッグデータ時代のバイオインフォマティクス をいかに発展させることができるかを議論する。
15:00-15:10 趣旨説明

15:10-15:25
環境情報を利用した微生物統合データベースの超高度化
東京工業大学大学院 生命理工学研究科 森宙史

要旨 微生物は、地球上のほとんど全ての環境に存在し、人間活動にも多大な影響を与えている。我々はそれら微生物についてゲノム情報と関連する情報を Semantic Web技術を用いて統合し、生命科学の研究者のみならず異分野の研究者にとっても有用となる、微生物統合データベースMicrobeDB.jpを開発して いる。本発表では、ともすると統計量の羅列となってしまいがちな生命科学データベースを、「超高度化」して様々な研究者が仮説生成を容易に行うことが出来 るようにする試みの一例として、MicrobeDB.jpにおける「超高度化」の取り組みを紹介する。

15:25-15:40
ディープラーニングを用いたビッグデータ創薬
京都大学大学院 医学研究科 浜中雅俊

要旨 ディープラーニングを用いて100万件超のタンパク質と化合物の相互作用を学習し、新たなタンパク質と化合物の相合作用を高い精度で予測する試みについて述べる。

15:40-15:55
データは語る。データに語らせる。生命科学にとっての人工知能とは?
産業総合技術研究所 創薬基盤研究部門 瀬々潤

要旨 バイオインフォマティクス(生命情報学)において「人工知能」は2つの意味を持ちます。一つは大規模に観測されるデータを解析し、要約する人工知能。もう一つは脳に代表される生命の持つ知恵がどのようになりたっているかを知る、再構成された「人工知能」。
本講演では、これらは互いに依存し、相乗効果で両者を高める必要があること、そして、そのキーポイントは「データに語らせる」ことであることを紹介します。

16:00-16:20
ロボットと人工知能で拓くサイエンスの未来
産業技術総合研究所 創薬分子プロファイリング研究センター 研究センター長 夏目徹

要旨 少子化、バイオハザード、ミスコンダクト等々、ライフサイエンスを取り巻く状況は悪化の一途をたどる。本講演では、これらの問題を全て解決し、研究者の個 人生産性を飛躍的に向上させる「汎用ヒト型ロボット技術」について講演する。ロボット化の目的は、単に人間が行ってきた作業を自動化することではない。ロ ボットの真の価値は、熟練者の技術を可視化・最適化することにあり、最適化された技術が、再現共有されることによりロボットの価値は最大化する。近い将 来、ロボットと人工知能が研究者を労働から解放する未来について議論する。

16:20-16:40
データベースから眺めるこれからのバイオインフォマティクス
東京大学大学院理学系研究科 生物科学専攻 教授 高木利久

要旨 ライフサイエンスの分野では、近年、ビッグデータ、データサイエンス、人工知能、ディープラーニング、などのキーワードが大きな注目と期待を集めている。 さらに言えば、これらの技術を活用すれば、どんな問題でもすぐに解けるかのような誤解さえ生じているのではないかと思われる。そうであれば、NGSなどの 最新の装置を使って、どんどんデータだけを出せばよいことになるが、そんなうまい話はない。

確かに、ライフサイエンス分野には膨大なデータが蓄積されており、また、データ産出は日々加速している。しかしながら、ライフサイエンス分野のデー タにはさまざまな種類や特徴があり、単にどこかのレポジトリに入れておけば解析できるという訳ではない。我々は、これらの多種多様かつ膨大なデータの共有 と整理統合を目指した統合データベースプロジェクトを2006年から実施してきた。このセッションでは、このプロジェクトを簡単に紹介するとともに、この 経験を踏まえて、今後のバイオインフォマティクスを展望する。

16:40-17:00
人工知能がノーベル賞を獲る日:科学的発見のエンジンを作る
システム・バイオロジー研究機構 代表 北野宏明

要旨 人工知能の歴史においてグランドチャレンジは、研究を加速し多くのブレークスルーをもたらしてきた。コンピュータ・チェス、RoboCup、 Jeopardy! Challengeさらに、DARPA Grand Challengeなどから派生した手法は、人工知能のみならず、広範な計算機科学とその応用分野の起爆剤となってきた。この講演では、新たなグランド チャレンジを提示する。それは、「2050年までに、生命科学分野においてノーベル賞級の発見を行う人工知能システムを構築する」というものである。この チャレンジの本質は、科学的発見のプロセスの理解と再定義・再実装である。ノーベル賞は、狂言回しにすぎない。生命科学では、大量のデータは文献を理解 し、不完全かつノイズの多いデータを解釈し、高次元非線形な対象物の理解を目指す。このどれもが人間が不得意なことである。つまり、我々は、生命科学の研 究は、本質的に苦手である。さらに、科学的発見は、セレンディピティーや科学的直感力という名の偶然に依存している。この状況に革命をもたらし、科学的研 究に産業革命をもたらすことがこのチャレンジの目的である。本講演では、科学的発見の認知的ボトルネック、グランドチャレンジへのアプローチなどに関して 議論する。このチャレンジの進展は、人類が未だかつてない速度で科学的知識を発見・蓄積し、フロンティアを拡大することを可能にする。

Kitano, H, Artificial Intelligence to win the Nobel Prize and Beyond: Creating the Engine for Scientific Discovery, AI Magazine, March 2016 (to appear)

17:00-17:20
人工知能からの生命科学研究への貢献:新たな方法論の構築を目指して
産業総合技術研究所 人工知能研究センター 研究センター長 辻井潤一

要旨 膨大な実験データ、膨大な論文数と、現在のビッグサイエンスを取り巻く状況は、一人の研究者が単独で研究を進めていくというモデルでは対応できない。個々 の科学者の経験や知識を生かし、かれらの持つ研究対象に関する直観を最大限に引き出すための枠組みが必要となっている。データの収集から科学的な仮説の構 築まで、人工知能が貢献できる分野は広がってきている。従来のデータサイエンスから一歩進んで、データから自律的に研究対象のモデルを構築することは可能 であろうか?また、生命科学では、さまざまに異なった環境での観測データからモデルに必要な欠損データを推測する必要がある。データからの帰納的なデータ の推測、積極的に欠損データの収集など、機械学習からロボティクスまでを動員した、新たな科学研究の方法論の構築が求められている。本講演では、この新た な方法論の構築に向けて、議論したい。

17:20-17:30 総合討論