ランチョン
10月29日(木) 11:40-12:40 第2会場
ライフサイエンス業界でのビッグデータ運用について
平野 勝久(CTCライフサイエンス株式会社)
要旨 ビッグデータを運用する為に必要な事は、運用する為のツールとビッグデータコンテンツのタイプを理解する事である。ビッグデータ自体は単なるデータの集まりである。そのためビッグデータ運用にはIT経験や統計解析の経験が以前は必要であると考えられていた。また、解 析ツールを含む高性能のITシステム等も必要であった。しかし、最近では可視化ツール等の発展を中心としたITの進化、解析サービス等を中心としたITベ ンダーのサービス等の変革、医療データビジネスの発展等によりITや統計解析の経験がなくともビッグデータを用いた業務改革を実施する事が可能となった。 また、海外の製薬メガファーマでは電子カルテデータ医療データベースを用いた事例も散見されるようになった。
ビッグデータを効果的に運用する為には、適切なITシステム構築とその運用体制の確立、さらには目的に合ったビッグデータを選択する事が現在の課題であると考える。
本講演では、これらの課題の解決のヒントとして医療データベース(電子カルテ)のElectronic Health Recordの海外事例を紹介すると共に製薬業界を中心としたライフサイエンス業界で必要とされるビッグデータ運用に必要なITシステム、医療データを選 ぶときの留意点、医療データの運用のポイント等の解説を行う。
10月29日(木) 11:40-12:40 第3会場
PDBj&創薬等ランチョンセミナー「生体高分子の立体構造データをめぐる最近の動向」
要旨 生体高分子の立体構造データをめぐる最近の動向について以下の三つの発表を行います。一つ目は、PDBjが開発した新しい分子ビューワー Molmil(「モル見る」)の紹介(*1)です。Molmilは、モダンなブラウザのWebGL技術を用いることで、プラグインなしで実行でき、スマホ やタブレットでも動作します。PDBjの様々なサービスと統合されているほか、ユーザーが独自に機能を拡張して、例えば分子動力学のアニメーションを作成 することも可能です。二つ目の話題は、NMRデータを扱うPDBj-BMRBについて(*2)です。昨年度から、相互運用性の高い新しいフォーマット (BMRB/XML・RDF)を開発し配布しています。今回、このフォーマットを活用し、関連データベースを統合検索するWEBサイトを開発しました。タ ンパク質の構造、機能、疾患関連、相互作用情報等のメタ情報を扱うことができます。三つめは、新たな立体構造データとして注目されている電子顕微鏡の三次 元密度マップについて(*3)です。密度マップデータを活用するために我々が開発した、EMDB内の3次元密度マップとPDBの原子モデルをシームレスに 比較する「Omokage検索」と、密度マップ・原子モデルの重ね合わせを行う「gmfit」の紹介を行います。(*1) Gert-Jan BEKKER(大阪大学蛋白質研究所)
(*2) 横地 政志(大阪大学蛋白質研究所)
(*3) 川端 猛(大阪大学蛋白質研究所)
10月30日(金) 11:40-12:40 第2会場
次世代シーケンサーをもっと身近に、日常的に。データを安全・高速・簡単に解析するクラウドサービスBaseSpaceのご紹介
長井 陽子(イルミナ株式会社 シーケンシングスペシャリスト)
要旨 次世代シーケンサー(NGS)が登場して数年が経ちましたが、まだまだ技術革新は続いています。今年、イルミナからHiSeq X Five、HiSeq 3000/4000、NextSeq 550システムをリリースし、圧倒的なデータ産出の量とスピードを達成しております。1台のシステムからテラ単位の膨大なデータ量が産出される時代とな り、データを保管し解析するための高性能なコンピュータインフラストラクチャーの必要性がNGSシステムの最大の課題の1つとなっております。イルミナで はNGSデータの安全な保管およびデータを共有するためのソリューションとしてクラウドサービスBaseSpaceを提供しております。BaseSpaceにアップロードされるデータはAES256を使用して暗号化されSSL通信によって守られており、BaseSpace上にあるデータ は、銀行や病院、製薬企業への導入実績があるAmazon Web Services(AWS)のセキュリティ基準によって守られております。また、AWSのプラットフォームのマルチノードを利用することにより、これまで 数日かかっておりました全ゲノムシーケンスデータのアライメントおよびバリアントコールでは96サンプルを2時間で解析することを実現しました。
BaseSpaceでは、スタンダードな解析パイプラインを簡素化したイルミナ開発のコアアプリの他、企業あるいはアカデミアが開発された幅広いアプリ を提供しています。これらを用いることにより、基本的なデータ解析はもちろん、データの可視化やアノテーションなどを専門的なデータ解析スキルがなくと も、簡便に実施できます。
本セミナーでは、世界のクラウドの利用状況から弊社BaseSpaceの安全性、高速さ、簡便さ、そして新たに追加されたアプリケーションをご紹介いたします。
10月30日(金) 11:40-12:40 第3会場
事例で知る賢いクラウド活用法 ―早い、安い、旨いは本当か?―
牧口 大旭(三井情報株式会社 バイオメディカル室)
要旨 近年、生命情報科学の分野でも分析機器類の高度化などにより、解析対象となるデータ量が飛躍的に増加しています。そうした中、ビッグデータの解析基盤、計 算機資源、データ共有、セキュリティといった課題に対応するため様々なクラウドサービスが登場しています。本セッションではバイオインフォマティクスに長 年取り組んできたMKIが、様々なニーズにおける最適なクラウド活用法を、事例を交えてご紹介していきます。前半にクラウドサービスの代表格であるAWS(Amazon Web Services)を素材に、クラウドサービスとは何か?その支持されている理由を解説します。後半では、実際の現場でどのようにクラウドサービスを役立 てていくのか?オープンサイエンス推進の立場に立ったデータ共有/解析基盤構築の他、大規模なITリソース活用事例、限られた予算の中でも大きな計算資源 を活用する為のノウハウなどを紹介します。
10月31日(土) 11:40-12:40 第2会場
大規模データ処理におけるHPC、可視化システムのご紹介
朝倉 博紀(日本SGI株式会社)
要旨 近年、デジタルデータの爆発的な増加が注目されています。サイエンスの分野でも次世代シーケンサに代表される分析機器の飛躍的な進歩により、従来では考えられない量のデジタルデータを高速かつ低コストで取得できる環境が整いつつあります。
今日の環境は、大量のサンプルデータとの比較を可能にし、容易に多角的で広範囲な分析が行え、さらなる価値を見出す研究が発展すると考える反面、こうした データサイズの大容量化により従来のワークフローでは処理をしきれないというジレンマがつきまとうことも事実であります。
本セッションでは、上記課題を解決することを目的とした大規模データ処理を担うHPCシステム、研究成果結果を容易に伝える可視化システム、人工知能処理の可能性について、弊社ソリューションと共にご紹介いたします。