データ収集-MW1

2021.9.18

情報化学+教育 > MAGICIAN 養成講座 > マイクロ波と3つのMI > その1、データ収集 

MAGICIAN(MAterials Genome/Informatics and Chemo-Informatics Associate Networks)
MAGICIANとは、材料ゲノム(Materials Genome)、材料情報学(Materials Informatics)、情報化学(Chemo-Informatics)を結びつけて(Associate)ネットワーク(Networks)を構築していかれる人財です。

「第15回日本電磁波エネルギー応用学会シンポジウム」発表の連動ページです。

データ収集

所属機関のない個人が集める事ができるデータ数には自ずと限界があります。
本屋で売っている書籍、ネットに転がっているフリーの論文、特許がデータソースになります。
逆に言えば、もっとデータを持っている機関、実験データを出す事ができる組織は、MAGICIANの基本を身につければ、さらに高度なことはいくらでもできるという事です。

そして、知らないかもしれませんが、MAGICIANの基本はとても簡単な事です。

そしてデータ駆動型(データ・ドリブン)の研究はデータの収集が命です。

データソース

参考書籍:
マイクロ波の新しい工業利用技術 NTS
マイクロ波化学 堀越ら 三共出版
化学を変えるマイクロ波熱触媒 柳田 NeoBook
初歩から学ぶマイクロ波応用技術 マイクロ波応用技術研究会
マイクロ波の化学プロセスへの応用 和田ら CMC出版
マイクロ波化学プロセス技術II 竹内ら CMC出版

ネット上の論文、特許など。

有機物のデータ収集

どのような構造の化合物がマイクロウエーブでどのくらい加熱されるか?を解析するために、500W(アセトニトリルだけは200W)のマイクロウエーブを1分間照射した時、ある液体が何度まで昇温されたかのデータを集めました。以下のテキストエリアの中身をコピーして、表計算ソフトにペーストしておいてください。

最初の液体の温度が記載してあったり、無かったりするのでそんなに綺麗なデータではありません。データソースによっては違う値が記載されているかもしれません。

このデータの中で、SMILES構造式はあまり馴染みがないかもしれません。
Smiles(Simplified Molecular Input Line Entry Syntax)というのは有機分子の線形表記法の一つです。 この方法のメリットはアスキー文字列の小さなサイズでコンピュータが理解できるように分子を表記できる事です。表計算ソフトに貼り付けて利用するには最適です。

また、HSPiPやRDKit、その他の識別子作成ソフトも、その多くはSMILESのインプットをサポートしています。

Smilesの分子構造式の簡単な説明

  • 分子の水素は書かずに重原子の元素記号だけ線形に表記する。
  • 有機化学用のC, N, O, P, S, F, Br, Cl, Iは角括弧は省略。他の原子には[]をつける。
  • 枝分かれは()を使う。
  • 2重結合は=,3重結合は#で表す。
  • 環状構造は環の結合を一つ切りその両端に1以上の同じ数字をつける。

さらに、

  • 2分子を扱う時にはピリオドで結合する。
  • チャージを扱う時には[]の中に原子を書き+、ーをつける。
  • 共役構造は小文字で表す方法もある。

など細かい規則があります。   

詳しくはDaylightのホームページを参照してください。
1分間照射に限らず有機物に関するデータを集め終わったら、その識別子の作成をおこないます。

識別子の作成

へお進みください。

無機物のデータ収集

無機物と言ったときに、それを大別すると、元素単体、酸化物、ハロゲン化物(特に塩化物)に分かれます。

先ずは、元素単体のデータになります。

このデータも表計算ソフトにペーストしておきましょう。

次に酸化物のデータです。

酸化物に関しては取り扱いがとても難しいです。同じ元素でも酸化数によってマイクロウエーブの吸収が異なります。また照射時間によっても到達温度が極端に変わります。

照射時間と到達温度には次のようなパターンがある事が知られています。

そこで、時間に関してはとても難しくなります。
詳しくは、「固体のマイクロ波加熱」化学と教育 54巻8号(2006)を参照してください。

最後に塩化物のデータです。

ほとんどの塩化物はマイクロウエーブをわずかしか吸収しません。

これ以外にも、最新のデータをお持ちの場合、周波数や出力など詳しいデータを持っている場合には付けくわえたデータセットを準備します。

データを集め終わったら、その識別子の作成をおこないます。

識別子の作成

へお進みください。

データを収集してやりたいことの確認

本来、照射ワット数や時間あたりの昇温曲線が全ての対象でわかっているならデータを集めれば終わりです。

残念ながらほとんどのデータは無いので、

  • 存在するデータを集める。
  • そのデータから予測式を立てる。
  • 未知の物質の昇温状態を予測する。
  • 信憑性を考える。

この繰り返しになります。

汚いデータを削ぎ落とす(データのクレンジング)のが大変です。

クレンジングは和製英語なので外人には通じません

情報化学+教育 > MAGICIAN 養成講座 > マイクロ波と3つのMI > その1、データ収集 

Copyright pirika.com since 1999- 
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。