沖縄や横須賀で有機フッ素化合物、PFOA, PFOSの汚染が深刻だ。活性炭で浄化した水を安心して飲めると言えるだろうか?
元々は戦闘機の火災時の消化剤に(泡消火器)に使われていた。少量で永続的な泡を作るのに適した界面活性剤だ。
それが、環境に漏れたときに、活性炭で吸着できるかどうか? 質問されたらどう答えるだろうか?
例えば、シックハウスで問題になったような、ホルムアルデヒドやアセトンは活性炭では吸着しない。
化学工学の世界では、水(酸、塩基)に溶ける親水的なものは吸収塔で、疎水的なものは活性炭の吸着塔でと習うだろう。
フッ素の部分は疎水的で、カルボン酸の部分は親水性、しかもLi、Na, K塩になっていればすごく親水性だろう。
MI/AI/MLとかをやっているなら自分なりの答えを30分もあれば理由を添えて答えられるようにしよう。(ネットで論文探して・・・っていうのはなしだ。)
学習データとしては、
吸着性指標(AI)による活性炭平衡吸着量の推算法という1986年の論文を使う。
自分で打ち込んで自分でやってみよう!って言いたい所だが、まず誰もやらないだろう。データは次のものをコピペしてやってみよう。
このデータがあれば、HSPiPを持っていれば5分、RDKitや分子軌道計算を行なっても15分もあれば必要な情報は手に入る。
化学が専攻で、分子の名称と構造がある程度読み取れるなら、芳香属や塩素や臭素のついた化合物はlogK(吸着定数)が大きいなどは簡単に見て取れるだろう。
例えば、SMILESの構造式を使ってRDKitで識別子を作成してしまい、log Kとグラフを描くを繰り返す。
関連がありそうな項目を抜き出すと、上の、Chi3V, LabuteASA, MR(Molecular Refraction)の3つであった。
そして、
PFOA( 2.60, 124.7, 43.37)
PFOS( 3.92, 145.7, 52.2)
この値を上のグラフに入れて、logKがいくつぐらいか見積もる。
HSPiPを持っているなら、tot HSP/MVolを計算してみよう。
tot HSP=sqrt(δD2 + δP2 + δH2)
表面張力を計算するためのParachorや分極率も相関が高い。
PFOA( 0.062, 496.7, 19.18)
PFOS( 0.06, 608.86, 20.13)
この値を上のグラフに入れて、logKがいくつぐらいか見積もる。
識別子は何でも良いから、とりあえずどんな分子も計算できるとMOを使うことも多い。
しかし、このようにグラフを書いてみると、どうもたいして相関がない。
150個ぐらいの、この計算なら一つ一つに相関がなくても、ニューラルネットワークが多変量解析で、中身はブラックボックスだが式を見つけてくれる。
ただ多くの場合、データが増えると破綻する。
できるだけ単相関を見つけ出し、何故それが相関を持つのか考える癖をつけないと研究者として枯れていく。
MIRAIやGROVEなどのpirikaの解析ツールを持っているならQSAR式を作成してみよう。
重要な項目を自動選択させて式を作成させる。
変数を3つ選んで式を作るとこのようなる。
後は、PFOA, PFOSの値を式に入れれば、定量的な値が求まる。
RDKitの識別子を使って計算式を立てる。
MOの結果を入れて計算式を立てる。
ランダムフォレストのやり方に近いが、いくつもの式を作成して、どの式もPFOA, PFOSのlog Kが高いと言ってくれれば、やっと安心して活性炭で浄化した水を飲むことができる。
ただし、これは酸型の分子の計算だ。Li、Na, K塩になっていると水への溶解度がずーっと高くなるのでこのようには行かない。
また、環境中のPFOA, PFOS濃度は非常に薄い。
しかも、競争的に吸着されやすい疎水性の分子が世の中には溢れている。
まー、まず、取れないだろうな。
増大してしまったエントロピーを元に戻すのはものすごく大変なことだ。
界面活性剤の解析と水和構造の推定(前編)
界面活性剤、水和構造の推定とドラッグ・デリバリー・システム(DDS)(後編)