研究紹介

本研究室で行っている研究テーマを紹介します。

深層学習法を用いた活性予測システムの開発

深層学習(Deep Neural Network:DNN)が画像認識・音声言語処理のみならず,創薬分野においても有用な手法であるとして注目を集めている.そのきっかけは,定量的構造活性相関(Quantitative Structure-Activity(or Affinity) Relationship: QSAR)を用いた医薬品候補化合物探索に関するコンペティション[1]において,特徴選択や特徴量を作るといったそれまでの手法をほぼ用いない,深層学習を使用したチームが首位を取ったことが挙げられる[2].しかし,入力データとして画像等と性質が異なる分子を対象としているにも関わらず,ほぼ同様の方法で解析が行われている.そのため,本問題に最適なDNN手法を確立することにより,更なる精度向上が望めるのは明白である.また,創薬研究分野からは,教師なし学習による予測システムの開発なども求められている.こうした問題を解決するためには,候補分子の情報を損失することなく解析すること,DNN法を用いる際の最適なパラメータ設定を解明することが重要となってくる.本研究では,深層学習を用いた独自の活性予測システムを開発することを目的とし,活性予測性能の更なる向上を行うために,本研究室で開発している立体構造探索システムや分子計算技術を活用した,独自の三次元形状ディスクリプタの新規開発も行う.深層学習による活性値予測では,あらかじめ選択した多数の分子記述子(ディスクリプタ)を1セットとした分子指紋 (Molecular Finger Print:MFP)を多数の候補分子に適用する。この候補分子のMFPセットを入力データとし,各候補化合物と標的タンパク質の活性値(実験値; 教師信号)を一致するように学習させる.

多分木アルゴリズムを用いた標的タンパク質ペプチド結合部位の探索

近年の医薬品開発の主流はバイオ医薬,特に抗体医薬に移行してきています.

糖タンパク質である抗体には可変領域と呼ばれる部位があり,これが抗原の部分表面構造を特異的に認識しています. つまり,可変領域のペプチド配列は多様性を持ち,このペプチド配列の違いが結合する抗原を選んでいることになります.

抗体医薬を高速に開発するには,特定の配列を持つペプチドが標的タンパク質に結合する位置と形を迅速に予測することが重要です. リガンドとなるペプチドには10残基以上で構成されるものもあり,これらは多くの官能基を持ち,配座も柔軟です. このようなペプチドを原子間の相互作用ポテンシャルによるドッキング法に適用することは厳しいことが考えられます.

そこで本研究では,Tropsha等が開発した立体構造が既知のタンパク質内で,近接する4つのアミノ酸残基の組み合わせを統計処理することにより得られる 粗視化4体ポテンシャルを標的タンパク質の表面とペプチド間の結合親和性の評価に応用することで,新しいドッキング技術を開発しています.

タンパク質立体構造解析のための統計的粗視化-四体ポテンシャルの改良-

タンパク質は,特定の部分(活性部位)に特定の形をした分子が結合することで,その効果を発現または阻害する. このことは,薬剤開発においても重要であり,タンパク質の立体構造の把握することは有意義である. しかし、立体構造の決定はX線結晶構造解析,NMR(Nuclear Magnetic Resonance)等の実験的手法が主である. ロースカロナ大のKrishnamoorthy等によって,タンパク質構造解析法である「四体ポテンシャル法」が開発された. この手法は既知である複数のタンパク質立体構造から四体ポテンシャルを導出し, その四体ポテンシャルを用いてタンパク質の立体構造解析を行う経験的ポテンシャルである. 四体ポテンシャルとは各アミノ酸残基を代表点として粗視化し, Delaunay四面体分割により近接する4つの代表点を頂点にする四面体の集合体としてタンパク質の立体構造を表し, 四面体の頂点にある残基種の重複組み合わせ(8,855種類)と,辺を構成する残基間結合パターン(5種類)に従って 四面体を44,275種類のクラスに分類し,既知の立体構造における各クラスの出現頻度によりスコアが与えられる。 タンパク質の立体構造を各四面体のスコアを積算したトータルスコアによって評価し, スコアが高いほど既知の立体構造で出現する頻度の高い四面体で構成されていることになり, より存在する可能性の高い立体構造であると評価できる. 既存の方法では,アミノ酸残基間の相互作用といったものは考慮されていなかったが, 立体構造を維持するうえで重要な残基間の水素結合相互作用に着目し, 四体ポテンシャルの改良およびシステムの開発を行っている.

結晶多形スクリーニング技術の開発

弱い相互作用からなる有機分子の結晶構造には,充填様式や配座異性体に起因する多形現象が確認されている. 結晶多形構造の違いが物性に大きく影響するため,それを予測し制御することによって新素材や新薬などの開発効率の向上につながる. このような試みは結晶構造予測のブラインドテスト(Crystal Structure Prediction Blind Tests) としてコンテスト形式で数年おきに行われ,国際的に注目される研究分野である.CONFLEX邃「ではMMFF力場による 球状微細結晶モデルを使った結晶構造の最適化が可能で,任意の初期構造から局所的最適化結晶構造,すなわち結晶多形構造を得ることができる.




本研究では,多くの結晶多形を網羅的に探索することができる,結晶多形スクリーニング技術の開発を目指し,その有効性の確認も行っている.



並列分散処理技術を用いた結晶計算の高速化

マルチコアCPUによる演算性能の向上は分子シミュレーションを急速に発展させている. 特に結晶計算はナノ科学や創薬,機能性材料など多方面での重要な役割を担い今後の発展が期待されている. 結晶計算は多数の分子を含む分子集合体を対象とするため非常に高い演算性能が必要となる. 結晶の対称性と周期性からわかるように,結晶計算は元来並列分散処理に適した計算モデルであると言える. 本研究室で開発している分子シミュレーションプログラムCONFLEXの結晶計算機能はネットワーク接続を用いた PCクラスタを利用することで分散メモリ型並列処理技術MPIによる高速な結晶計算が可能となっている.

そこで本研究では近年急速に発展したマルチコアCPUに適した共有メモリ型並列処理技術であるOpenMPを用いて 高速な結晶計算技術の開発を試みる.また,分散メモリ型と共有メモリ型のハイブリッド型並列処理技術へ展開する ことを目標とする.

結晶計算アルゴリズムKESSHOU法では,空間群と格子定数により有効結晶半径にレプリカ分子を展開し球状結晶を構築, その後オリジナル分子と全レプリカ分子を計算する.

分散共有メモリ 球状結晶

水溶液中の糖および糖鎖の立体配座解析

糖タンパク質や糖脂質として細胞膜上に存在する糖鎖は、核酸、タンパク質に次ぐ第三の生体高分子として注目を集めています。 その役割は、細胞間の 接着や情報伝達、ウィルスの標的部位となるなど、多岐に及ぶことが明らかにされてきています。 それらは糖鎖の複雑でフレキシブルな立体構造に起因すると言われており、生体内におけるこれらの構造を解析することは、 生命現象を解明する重要な指標になると期待されています。

これまでの研究から、糖残基やグリコシド結合の安定コンホメーションの組み合わせから糖鎖構造の大まかな全体像の予測が可能となってきています。 しかし、特に糖鎖認識機構において重要であるとされる、糖鎖とそれを認識するタンパク質(レクチン)との間の相互作用は、 それに加えて糖残基の六 員環上の水酸基の配向や分子内、水分子、あるいはグリコシド結合を介した糖鎖残基間の水素結合構造を明らかにすることが重要です。 そのため、それらを明らかにし、糖残基を比較的簡単に解析できる手法の確立が望まれています。

種々ある実験解析手法のうち溶液NMR法は、分子量が比較的少なく水溶性の糖鎖に対して特に相性のいい手法と言えます。 NMR法から得られる結合定数のうち、3結合を介した1H-1Hスピン-スピン結合定数(3JHH)は、糖の環構造の特定に用いられています。 一方、2結合を介した 13C-1Hスピン-スピン結合定数(2JCH)は六員環上の8種の値によって糖残基の種類が同定可能なことが 横浜市大の及川等によって示され [1]、また隣接する水酸基の回転異性に強く依存することが理論計算から明らかにされつつあります[2]。 これらを用いることで、活性部位周辺で 糖残基が関わる水素結合構造などを解明するための手掛かりとなることが期待できます。

現在本研究室では、これらの結合定数を用いた水溶液中の糖のコンホメーション予測を目的として、理論計算によるNMR実験値の再現を試みています。

AR技術を用いた 分子可視化システムの開発

ポリエーテル化合物の酵素触媒反応の遷移状態

天然に数多く存在する有機化合物には,微生物が産生する二次代謝産物のように医薬品として利用されているものが多数あります.
中でも複雑な環構造を有するポリエーテル系化合物は,有機合成的には大きな困難が伴うため,生体内と同様に酵素反応を 活用した効率的な合成法の開発が期待されています.しかし極めて少数の酵素が効率的に関与していると思われる ポリエーテル環構築生合成機構は未だ解明されていません.

最近,北大の及川等は大量発現したポリエーテル環化酵素Lsd19を用いて, 有機合成した仮想中間体をポリエーテル化合物lasalocid A に変換する酵素活性を 世界で初めて検出することに成功しています.(Scheme 1)

本研究は、Lsd19による酵素触媒環化反応の遷移状態をONIOM法を使用し 解析した結果を報告することを目的としています。

活性化エネルギーの算出
lasalocid1 lasalocid2