識別子(Descriptor)の作成-MW2

2021.9.19

情報化学+教育 > MAGICIAN 養成講座 > マイクロ波と3つのMI その2、識別子(Descriptor)の作成 

MAGICIAN(MAterials Genome/Informatics and Chemo-Informatics Associate Networks)
MAGICIANとは、材料ゲノム(Materials Genome)、材料情報学(Materials Informatics)、情報化学(Chemo-Informatics)を結びつけて(Associate)ネットワーク(Networks)を構築していかれる人財です。

識別子、記述子(Descriptor)という言葉は馴染みがあまりないかもしれません。
統計などでは、説明変数という言い方をします。

500Wのマイクロ波を1分間照射した時の到達温度を目的変数とします。
本来、500Wや1分間というのも説明変数になります。ワット数が高ければ目的変数が高くなり、時間が長くなれば目的変数が高くなります。

それらが固定の時には、変数にはなりませんが、他にどんな変数を使ったら、到達温度、目的変数を説明できるか?を考えます。

ただし、できたものがマイクロ波で壊れてしまうこともあります。

水などの極性溶媒は大きく昇温するようです。それなら、誘電率やダイポールモーメントで説明できるかもしれません。

教科書をみると誘電損失だとか、tanδ(誘電正接)とかと相関があると記載されています。

そうしたデータと昇温温度のデータは次のようになります。

表計算ソフトにコピペしてグラフを描いてみましょう。

例えば、誘電率の場合には次のようになります。

大まかには、誘電率が10増えるごとに、到達温度は50℃高くなると言えます。

到達温度=(50/10)*誘電率

従って、誘電率を識別子(説明変数)に使えば到達温度(目的変数)を予測できることになります。

では、到達温度が未知の乳酸の到達温度を予測してみましょう。
その時に誘電率のデータがあれば良いのですが、有機化合物の誘電率、特に室温で固体の物質の誘電率のデータは非常に少ないのです。

また調べてみると分かるのですが、誘電率の推算の方法も知られていません。

ということは、誘電率を識別子(説明変数)にしても、ほとんどの化合物は予測不能になってしまします。

では、ダイポールモーメントを使ったらどうでしょうか?

これも、ざっくり

到達温度=(100/2)*ダイポールモーメント

と言えなくもありません。
また、ダイポールモーメントは、分子軌道計算などで算出する事ができます。

ところが、半経験的分子軌道法、MOPACで計算したダイポールモーメントの値との相関は実測のダイポールモーメントと比べ、かなり低くなってしまいます。

誘電損失やtanδはデータ数も少ないし、精度的にも好ましく無いことがわかります。

私も詳しいわけでは無いのですが、誘電率はあまり温度依存性はないのですが、誘電損失、誘電正接などは温度や周波数によって大きく値が変わります。物質の温度が上がるにつれ、誘電損失、誘電正接が極端に変わるのであれば、25℃での値と到達温度の相関を考えても無駄ということになります。

データの中にはこうしたデータが混じっています。
本来なら、どのパターンか分類して、パターンにあった推算式を構築していくのが正しいのです。
でも、新しいものが、どのパターンなのか事前に分かれば良いのですが、それがわからないなら、取り敢えずできる限りの精度で答えを出していくことを考えるのも大事です。
さもないと、計算機化学は常に実験の後追いという汚名を着せられます。

ただ、闇雲にトポロジカルな識別子を使ったり、分子軌道法の結果を使えば良いというほど簡単な話でも無いのです。

ここでも、有機物と無機物で識別子の作り方は異なりますので、別々に説明しましょう。

無機物の識別子の作成法

高度な分子軌道計算や分子動力学計算を行わないという前提ですと、無機物に関して得られる識別子は書籍などに記載のものに限定されます。
おまけで、電荷平衡法で計算した元素の電荷の取り扱い方を学びましょう。

有機物の識別子の作成法

大学の授業で使っている、YMBを用いて識別子の作成方法を紹介しましょう。
さらに、RDKitを用いたトポロジカルな識別子、RDKitがSmilesの構造式から作り出す分子の3次元構造からCNDO/2で計算した分子軌道計算結果なども利用していきます。

情報化学+教育 > MAGICIAN 養成講座 > マイクロ波と3つのMI その2、識別子(Descriptor)の作成 

Copyright pirika.com since 1999- 
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。