pirika logo

ホームページ Pirikaで化学 ブログ 業務リスト お問い合わせ
Pirikaで化学トップ 情報化学+教育 HSP 化学全般
情報化学+教育トップ 情報化学 MAGICIAN MOOC プログラミング
MAGICIANとは、材料ゲノム(Materials Genome)、材料情報学(Materials Informatics)、情報化学(Chemo-Informatics)とネットワーク(Networks)を結びつけて(Associate)いかれる人材です。

MOOC(Massive Open Online Course)世界中の大勢の人々が参加できるオンラインのオープン授業のことです。

情報化学+教育トップ > MOOC講座 > 引火点の推算式を自分で作ってみましょう

2012.1.12  全面改訂2014.7.18

YMBとYSBの使い方を、引火点の推算式を自分で作って理解しましょう。
引火点は危険物の分類として非常に重要な物性値です。

第4類

引火点

 

 

 

特殊引火物

<-20℃

発火点<100℃ 沸点<40℃

ジエチルエーテル、酸化プロピレン

第1石油類

<21℃

ガソリン、アセトン、トルエン

第2石油類

21℃< <70℃

灯油、キシレン、クロロベンゼン

第3石油類

70℃< <200℃

20℃で液体

クレゾール、ニトロベンゼン

第4石油類

200℃< <250℃

20℃で液体

潤滑油、フタル酸ジオクチル

 

 

リチウム電池で使われている溶媒には次のようなものが知られています。
これらの引火点は次の値になります。

テキストエリアのデータを全てコピーして、表計算ソフトへペーストしておいてください。

課題: 何故、環状のカーボネートと鎖状のカーボネートで引火点がこれほど変わるのか考察してみましょう。
(こうした課題に対して、”わかりません。覚えますから答えを教えてください”という学生がいます。覚えるだけなら、AIには敵わないので、覚えても無駄です。)

次に、各溶媒のSmiles構造式から、YMBを使って様々な物性値を計算しておきます。
やり方がわからない場合にはこちらを参照してください。

引火点と計算された物性値がどのような関係にあるかは、グラフを一つ一つ眺めればわかります。
引火点がどんな物性値と相関があるのかを知ることができます。

これを行うには、まず表計算ソフトでグラフを描きます。
グラフを選択するとグラフで使われているカラムに色がつきます(X軸はピンク、Y軸は青。Macの場合)。
その段階で下図のようにマウスでドラックすると、X軸はそのままに、Y軸のカラムを入れ替えた図が表示されます。

F-Rub1

例えば次のような図が簡単に得られます。

FP-Tc

FP-Tc

2つ以上の物性値が絡み合って引火点を決めていると考えるなら、重回帰法を使います。
(重回帰法の基礎はMOOC-002のこちらのページを参照してください。)

例えば引火点を臨界温度と屈折率から推算するとしたら、次のようになります。

引火点予測値=0.8132*臨界温度-791.7183*屈折率+643.8141

FP-Tc

臨界温度の推算はPirikaのこちらのページを参照してください。
屈折率の推算はPirikaのこちらのページを参照してください。

非常に良好に引火点を推算することができるように見えます。

屈折率と引火点の相関はあまり高くないように見えますが、屈折率と臨界温度が組み合わされると、重回帰の結果としては相関係数が高くなります。

それでは、30種類以上のYMBが計算する物性値から引火点と関係する物性値を選択するにはどうしたらいいでしょうか? 
単独では相関が低くても、組み合わせで高い相関を持つことがあります。

例えば36個の変数から順列組み合わせで2つの変数を選択する場合の数は、36C2=630通り、3つの変数を選択する場合の数は、7140通りあります。
それらを全て重回帰計算して相関係数の高いものを選ぶのは非常に効率が悪いです。

何も考えずに、取り敢えず答えが欲しいのであれば主成分分析や、PLS法などで答えを求めるのも一つの方法です。

しかし、化学者としてのセンスを活かしたのなら、予測したい現象を説明できる因子を自分で考える癖をつけるのは大事なことです。
何故だかが示されたとき、材料、プロセスの改良方向がはっきり見えてきます。

この変数選択を自動で行うのがYSBの中の変数選択重回帰機能です。
選択したい変数の数を入力してSearchボタンを押すと、相関係数が高くなる変数の組み合わせを探索してくれます。
変数の数が多くなってきた時には有効です。

ただし、このプログラムは化学的な意味合いを考えて変数選択する訳ではありません。

例えばこの引火点の例では、臨界温度と屈折率を2つ選択すると一番高い相関となるという答えになりました。
ししか、屈折率がなぜ選ばれたかは化学的に意味が無いように思えます。
そこで幾つかの化合物の引火点をこの式を使って予測してみます。

Hcode CAS name Smiles 引火点℃
7 67-64-1 Acetone CC(C)=O -18
481 78-93-3 Methyl ethyl ketone CC(CC)=O 14
325 64-17-5 Ethanol CCO 13
255 60-29-7 Ehtyl ether CCOCC -45
297 68-12-2 N,N-Dimethylformamide [H]C(N(C)C)=O 58
367 107-06-2 1,2-dichloroethane C(CCl)Cl 13

追加化合物のSmilesの構造式から、YMBを使って臨界温度と屈折率を推算し、引火点を予測します。

すると赤四角で示すように、幾つかの化合物で誤差が大きいことがわかります。

FP-Tc

そこで、臨界温度と屈折率を消去して変数選択を繰り返します。
引火点と関係なさそうな変数を消去し変数選択を繰り返すと、最終的に得られた推算式は次のようになります。

引火点のモデル式=0.8362*沸点+0.0366*Heat of formation-286.7096

となりました。

FP-Tc

この式を使って追加の化合物の引火点を予測してみると上に示すように良好に予測できていることがわかります。

このように、引火点が、沸点(沸点が高いと蒸気の量が少ない)と生成熱(生成熱が小さいと分子が安定)とで表現されていることから、この推算式の妥当性が高いのではないかと予想されます。

もちろん、それ以外の変数を選択したとしても全く問題ありません
大事なのは、「モデル式を考える力を養う」につきます。

極端な事を言ってしまえば、自動で変数選択させて、予測性能が高いモデル式(何故かはブラックボックス)を導出するAIを作る事は簡単です。

課題:

自分で作った引火点の推算式で、グリーンソルベントの引火点を予測してみましょう。
グリーンソルベントに関してはMOOCのこちらのページを参照してください。

グリーン・ソルベント引火点データ

FP-Tc

私の作った例では、たった8個の引火点のデータから作成した重回帰式であるにも関わらず、そこそこ良好に引火点が推算できる事がわかります。
自分オリジナルのモデル式ではどうだったでしょうか?
変数2個に拘らずに色々な式を構築して、選ばれた物性値の意味を考えてみましょう。

課題:

どのような化合物の引火点予測値が誤差が大きいか特定し、その特徴を考えてみましょう。

化学プラントの事故

授業では化学プラントの事故をこれまでにも良く取り上げています。
アクリル酸、塩ビ、ABSなど、ポリマーを製造する際、原料のモノマーが引火して爆発する例を取りあげてきました。

実は引火点は沸点だけからでも良好に推算する事ができます。

FP-Tc

そこで、種々のモノマーの引火点と沸点の相関を取って、フッ化ビニリデンの沸点を入れれば、下図に示すように非常に精度よくフッ化ビニリデンの引火点を予測する事ができます。

モノマー 引火点データ

FP-Tc

引火点=0.8493*沸点-299.48

それでは、引火点の推算式は作らなくてよいかというと、そうは単純ではありません。

VOC(揮発性有機化合物)の引火点の推算に、この推算式を適用したところ、下図のようになります。

FP-Tc

課題:

どのような化合物が大きく外れるか特定してみましょう。 ざっくり見るとXX原子が入ると推算値が大きくずれている事が判ります。

それは例えばXX含有の化合物の場合、燃焼によって発生するXXラジカルが燃焼をクエンチするからです。

改良モデル式

そこで重回帰で計算するテーブルに、Formulaを参照に原子の数を付け加えます。

FP-Tc

すると重回帰の計算結果は非常に改良される事が判ります。

FP-Tc

課題:

この後に、再び誤差の大きな化合物を特定していきます。(環の数、2重結合の数、芳香環の数などに着目してみましょう)

そして、新しいカラムを挿入して重回帰を繰り返し、最終的な予測式を作り上げて行きます。

さらに必要に応じてクロスタームを導入していきます。

以上が自分で何かの予測式を作る時の流れになります。

こうした手間を省きたいのでしたら、ビッグデータを準備して、ディープ・ラーニングさせる事になります。
中身はブラックボックスですけど、答えを出してくれるかも知れません。
多くの場合は、自分の関連する小さな領域の確定されていない引火点が知りたいだけなので、ビッグデータは無いでしょう。
私が持っている引火点のデータ数は約5500件です。
このくらいでは、ビッグデータと呼ぶにはおこがましいでしょう。

YMBの推算値だけから作った予測式の相関係数がそれなりに高ければ、データ集、DBから実験値を持ってきてより精度の高い実験式を作るのもいいでしょう。
論文とか特許を書くときには大変役に立ちます。

逆に、こうした30個以上の物性値を、先にデータ集、DBから探してテーブルに入れこもうとする場合には膨大な作業となることは明らかだと思います。
しかも集めたデータが予測に役立つかどうかはわからないし、1つでも実験値が無ければ、そのカラムの他の化合物のデータは役に立たなくなってしまいます。

YMBのようなソフトを使って予備検討してから先に進む方が効率は高くなります。

練習問題:
実際のLiBにはEC:DMC:DEC=1:1:1の溶媒が使われることが多いようです。

FlashPoint は順に143℃:18℃:25℃です。

LiBの発火事故は中身の溶媒が自然発火温度まで達して爆発事故につながるケースが多いと考えられています。溶媒の発火温度は以下のようになっています。

自然発火温度の推算式を引火点と同じように構築してみましょう。
発火温度は鎖状のカーボネートと環状のカーボネートで差が少ない理由を考察してください。
また、データの無いジメチルカーボネートとγブチロラクトンの値を予測してみましょう。

2012年の講義ではボーイング787でLiBバッテリーが発火した事例を取り上げ、解析を行いました。

練習問題:

ボーイング787のLiBはGSユアサが製造ました。
宇宙用のバッテリーを手がけるなど非常に高度な技術を持っている同社の添加剤を解析してみましょう。
"ユアサ LiB 難燃剤”とインターネットで検索し、論文をダウンロードする。
下記の化合物がでてきます。

ジエチルカーボネート
(CF3CH2O)2C=O
(CF3CH2O)3O=O
CF3CF2CH2OCF2CF2H

各化合物のSmilesの構造式を得て、YMBを使って物性値を推算してください。
そして、沸点やAntoine定数を表にまとめましょう。

次にアントワン定数から蒸気圧曲線を描いてみましょう。
蒸気圧が5気圧になる時の各溶媒の温度を求めてください。


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。