ホームページ | Pirikaで化学 | ブログ | 業務リスト | お問い合わせ |
Pirikaで化学トップ | 情報化学+教育 | HSP | 化学全般 |
情報化学+教育トップ | 情報化学 | MAGICIAN | MOOC | プログラミング |
MAGICIANトップ | MAGICIAN-Jr. | MAGICIAN-講義 | 過去の資料 |
MAGICIANとは、材料ゲノム(Materials Genome)、材料情報学(Materials Informatics)、情報化学(Chemo-Informatics)とネットワーク(Networks)を結びつけて(Associate)いかれる人材です。
2020.10.22
1995年1月から1999年6月まで筑波の物質研に出向している間に、ニューラルネットワーク(NN)法による物性推算や遺伝的アルゴリズム(GA)法による逆設計を行いました。
その際に、物質研の先生を通じて、酸化物ガラスのデータを頂き、NN法、GA法で解析を行い計算機化学討論会で発表しました。
この方法は今で言う、マテリアル ・ゲノムで多用されている方法と同じです。
大きな違いは、データ量とコンピュータの能力でしょうか。
ビックデータが無いと、NN法は予測性能が非常に下がります。
しかし、ガラスの物性値は多いもので5000程度しかありません。
また、当時のコンピュータの速度、メモリー、HD容量から、3層以上のNN法は実質無理がありました。
そこで、私がよく使った方法は、再構築学習NN法と言うものです。
学習を繰り返す際に何回かに1度、結合荷重行列に忘却効果を導入します。
すると弱い結合荷重はさらに弱く、強い結合荷重はさらに強くなります。
NN法の学習結果は中身がブラックボックスになりがちです。
ところが、再構築学習NN法を使うと、情報の流れがはっきり見えてきます。
例えば、混合アルカリ効果と言うものがあり、ナトリウムとカリウムを混合した場合に、物性値が上に凸になる現象があります。
得られたニューラルネットワークの結合荷重のうち、NaとKのものだけ、値が大きなものだけを抜き出すと下図のようになります。
中間層のニューロンと入力層のニューロンの結合の符号はマイナスですが、中間層と出力層の結合はプラスが3つ、マイナスが2つになります。これがNa/Kの比率で物性値が非線型になると解釈する事ができます。
本来の変数は、入力ニューロン数*中間ニューロン数+中間ニューロン数だけあります。
酸化物が20種類、中間ニューロンが10個であれば、210個の結合荷重を決めなくてはなりません。
ところが、再構築学習法で80%の結合が消えてしまえば、40個程度の結合荷重で物性を予測できることになります。
それはすなわち、少ないデータでも予測式を作ることが可能であることに通じます。
少ないデータ。
過学習をさせない。
学習データの無い酸化物のデータを補完する。
今でも大事なものは変わりません。
Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。