pirika logo

Home 化学 HSP 情報化学+教育 PirikaClub Misc.
情報化学+教育トップ 情報化学 MOOC YMB MAGICIAN MAGICIAN Club
MOOCトップ

MOOC講座

2012.1.12

講義資料 非常勤講師:山本博志

抽出を考えてみよう。溶解性が基本だ。

 

化学工学の本を見ると、抽出操作の部分は3成分の溶解度平衡のデータからタイラインを引いて、うんたら、かんたらと説明されています。
20年近く前の”マイコンを使ったXXXX”という類いの本、最近の”Excelを使ったXXXXX"といった類いの本も変わりません。

Pirikaでは20年以上前からJAVAを使って化学用のプログラムを提供してきましたが、この抽出操作に関しては何も提供できませんでした。
その理由はプログラムが書けないからではありません。

3成分系の溶解度平衡のデータが、全く増えていかず、いつも、水-ベンゼン-酢酸などのデータを延々と使い続けています。 (もうベンゼンなんて使うはずないのに)

それでは任意の3成分系の溶解度平衡を推算できるかというと、それはできません。そこでプログラムを作る価値がなかっただけです。

しかし、化学の領域の研究をするのであれば抽出は重要な操作です。
医薬品などのように分子のサイズが大きくなってくると、蒸留で副生成物を分けるのは難しくなります。
熱安定性の低い化合物の分離にも抽出は欠かせません。

ある化合物をある溶媒(水である事が多い)から抽出するときに、どんな溶媒がいいか? に対してどのような提案ができるでしょうか?

YMBを使って検討してみましょう。
ここでいう抽出は分液ロートを使ってしゃかしゃか振った時をイメージしてください。

有機化合物の有機相-水相間の分配係数

課題: 化学便覧に以下の化合物の分配係数が記載されています。
各化合物をYMBを使って計算しましょう。

分配係数データ

Hcode CAS Solute Smiles 1-octanol diethyl ether chloroform carbon tetrachloride benzene hexane
456 67-56-1 methyl alcohol OC([H])([H])[H] -0.77 -1.15 -1.26 -2.10 -1.89 -2.80
325 64-17-5 ethyl alcohol CCO -0.31 -0.57 -0.85 -1.40 -1.62 -2.10
569 71-23-8 propyl alcohol CCCO 0.25 -0.02 -0.40 -0.82 -0.70 -1.52
92 71-36-3 butanol CCCCO 0.88 0.89 0.45 -0.40 -0.12 -0.70
552 71-41-0 1-pentanol CCCCCO 1.56 1.20 1.05 0.40 0.62 -0.40
930 111-27-3 1-hexanol CCCCCCO 2.03 1.80 1.69 0.95 1.30 0.46
931 111-70-6 1-heptanol CCCCCCCO 2.41 2.40 2.41 1.67 1.91 1.01
5 64-19-7 acetic acid CC(O)=O -0.17 -0.34 -1.60 -2.45 -2.26 -3.06
576 79-09-4 propanoic acid CCC(O)=O 0.33 0.27 -0.96 -1.60 -1.35 -2.14
114 107-92-6 butyric acid OC(CCC)=O 0.79 0.61 -0.27 -0.97 -0.96 -1.76
1022 142-62-1 hexanoic acid CCCCCC(O)=O 1.92 1.95 1.15 0.57 0.30 -0.46
1023 109-52-4 pentanoic acid OC(CCCC)=O 1.39 1.00 0.28 -0.42 -0.10 -1.00
861 76-03-9 Trichloroacetic Acid ClC(Cl)(Cl)C(O)=O 1.33 1.21 -0.69 -1.66 -1.30 -2.63
945 79-43-6 dichloroacetic acid OC(C(Cl)Cl)=O 0.92 1.31 -0.89 -2.31 -1.40 -2.72
129 79-11-8 chloroacetic acid OC(CCl)=O 0.22 0.37 -1.92 -2.56 -1.60 -3.14
464 79-20-9 methyl acetate CC(OC)=O 0.18 0.43 1.16 0.32 0.53 -0.26
328 141-78-6 ethyl acetate CC(OCC)=O 0.73 0.93 1.80 0.95 1.01 0.29
7 67-64-1 acetone CC(C)=O -0.24 -0.21 0.24 -0.30 -0.05 -0.91
331 75-04-7 ethylamine CCN -0.30 -1.18 -0.35 -1.27 -1.30 -1.77
580 107-10-8 propylamine CCCN 0.28 -0.54 0.26 -0.59 -0.52 -1.00
665 75-50-3 trimethylamine CN(C)C 0.27 -0.26 0.54 -0.09 -0.29 -0.48
105 109-73-9 butylamine CCCCN 0.74 0.11 0.56 -0.04 -0.08 -0.62
252 109-89-7 diethylamine CCNCC 0.57 -0.07 0.81 0.03 -0.05 -0.48
598 110-86-1 pyridine C1=CN=CC=C1 0.65 0.08 1.43 0.23 0.41 -0.21
46 62-53-3 aniline NC1=CC=CC=C1 0.90 0.85 1.42 0.60 1.00 -0.30
559 108-95-2 phenol OC1=CC=CC=C1 1.46 1.64 0.37 -0.36 0.36 -0.70
54 65-85-0 benzoic acid OC(C1=CC=CC=C1)=O 1.87 1.89 0.50 -0.22 0.21 -0.72
1055 55-21-0 Benzamide NC(C1=CC=CC=C1)=O 0.64 -0.22 0.11 -1.54 -0.71 -2.30
9041 135-19-3 2-naphthol OC2=CC1=CC=CC=C1C=C2 2.70 1.77 1.74 0.99 1.74 0.30
917 123-31-9 p-hydroquinone C1=CC(=CC=C1O)O 0.59 0.38 0.23 0.04 0.15 0.05
905 123-08-0 p-hydroxybenzaldehyde C1=CC(=CC=C1C=O)O 1.35 1.10 -0.12 -1.70 -0.55 -0.95
1204 69-72-7 salicylic acid OC1=CC=CC=C1C(O)=O 2.26 2.37 0.58 0.00 0.50 -0.57
9456 99-96-7 4-HYDROXYBENZOIC ACID OC1=CC=C(C(O)=O)C=C1 1.58 1.42 -0.50 -1.38 -1.07 -1.82
459 90-05-1 guaiacol COC1=CC=CC=C1O 1.32 1.44 1.70 0.98 1.32 0.36
7594 150-76-5 p-methoxyphenol OC1=CC=C(OC)C=C1 1.34 1.47 0.23 -0.34 0.27 -0.76
8893 88-75-5 o-nitrophenol OC1=CC=CC=C1[N+]([O-])=O 2.00 2.18 0.60 -0.64 0.48 -1.40
8894 554-84-7 m-nitrophenol OC1=CC=CC([N+]([O-])=O)=C1 2.00 2.18 0.60 -0.64 0.48 -1.40
936 100-02-7 4-Nitrophenol OC1=CC=C([N+]([O-])=O)C=C1 1.91 2.01 0.20 -0.92 0.17 -2.00
9611 579-75-9 O-ANISIC ACID COC1=CC=CC=C1C(O)=O 1.59 0.78 2.53 2.40 2.68 2.08
9704 121-92-6 M-NITROBENZOIC ACID O=[N+]([O-])C1=CC(C(O)=O)=CC=C1 1.83 1.97 0.48 0.15 0.21 -1.22
9453 118-92-3 O-AMINOBENZOIC ACID OC(C1=CC=CC=C1N)=O 1.21 1.43 -1.15 -1.10 -0.40 -2.12
8965 150-13-0 p-aminobenzoic acid OC(C1=CC=C(N)C=C1)=O 0.83 0.88 -1.52 -2.48 -1.46 -3.74
7563 88-74-4 o-nitroaniline NC1=CC=CC=C1[N+]([O-])=O 1.37 1.71 1.61 0.45 1.31 -0.62
939 99-09-2 m-nitroaniline NC1=CC=CC([N+]([O-])=O)=C1 1.85 1.95 2.13 1.08 1.78 0.25
7564 100-01-6 p-nitroaniline NC1=CC=C([N+]([O-])=O)C=C1 1.39 1.48 1.23 -0.14 0.93 -1.14
1162 121-33-5 vanillin OC1=CC=C(C([H])=O)C=C1OC 1.21 0.96 1.42 0.20 0.82 -0.72
10812 148-53-8 o-vanillin Oc1c(cccc1OC)C=O 1.37 1.35 2.30 1.40 1.87 0.53
21944 621-59-0 i-vanillin O=Cc1ccc(OC)c(O)c1 0.97 0.82 1.18 0.04 0.74 -0.85
431 78-83-1 isobutanol CC(C)CO 0.65 0.53 0.34 -0.32 -0.11 -0.60
20331 50-06-6 Phenobarbital CCC1(C(=O)NC(=O)NC1=O)C2=CC=CC=C2 1.71 1.51 0.62 -0.63 -0.01 -2.22
21943 76-74-4 Penttobarbital O=C1NC(=O)NC(=O)C1(C(C)CCC)CC 2.10 1.28 1.38 -0.03 0.74 -1.30

抽出に使った溶媒は、1-オクタノール、ジエチルエーテル、クロロホルム、四塩化炭素、ベンゼン、ヘキサン(ヘプタン)です。このうち、水と1-オクタノールの分配係数はlogKow, logPなどとも呼ばれる指標でYMBの中に推算値が記載されています。

Bunpai-logP

YMBの計算結果と化学便覧のデータとプロットすると上図に示すように非常に良好に推算できている事が分かります。

つまり、1-オクタノールを抽出溶媒に使う限りは、ある任意の溶質がどれだけ水に、どれだけ1-オクタノールに分配しているかはYMBで計算すれば分かることを意味しています。

自分が抽出したいものが1-オクタノールに多く分配していればそれでOKですが、そうで無かったらどうやって抽出溶媒を選択したらいいでしょうか?

Oct-DEE

ジエチルエーテルとオクタノールの分配係数をプロットしてみると、かなり高い相関がある事がわかります。
従って抽出溶媒として1-オクタノールで不十分であったのなら、ジエチルエーテルに変えてもあまりいい事はないでしょう。

同様にクロロホルムと四塩化炭素の分配係数も、当たり前の事ながら非常に高い相関があります。

Oct-DEE

そして、意外な事にヘキサンと四塩化炭素の分配係数には非常に高い相関があります。

Oct-DEE

ベンゼンとヘキサンの相関係数はあまり高くありません。

Oct-DEE

従って、化学便覧にデータのある、1-オクタノール、ジエチルエーテル、クロロホルム、四塩化炭素、ベンゼン、ヘキサンは、3つにグループ分けして考えればいい事が分かります。

いわゆる極性溶媒は水に溶解してしまうので、水系の抽出溶媒には用いる事ができません。

先に述べたように、1-オクタノールの分配係数は分子構造のみからYMBで推算することができます。

Oct-DEE

オクタノールとヘキサンでは極性がずいぶん異なるので上図に示すように相関が無ありません。
そこで、YMBとYSBを使ってヘキサンの分配係数を推算するモデル式を作ってしまうことを考えます。

Oct-DEE

課題: YSBを使って下のモデル式のA-Eの係数を定めてみましょう。

ヘキサン分配係数モデル式=A*logKow +B*Surface Area C*Ovality D*Density +E

こうしたモデル式が作製できると、ヘキサンとオクタノールで分配係数がどういう関係になっているか定量的に理解することがきます。

つまり、ある抽出したい溶質があったときに、YMBを使えばlogKowは推算できます。

こうしたことを、このモデル式は示しています。

課題: 同様に、ジエチルエーテル、クロロホルム、四塩化炭素、ベンゼンの分配係数をlogKowをベースに組んでみよう。

これらのモデル式が構築できると、あるターゲットの化合物を抽出する溶媒は、中間(極性に近い)、中間(非極性に近い)、非極性のどのくらいがいいか明確にわかるようになります。
AIにどのように分配係数を教えるかはともかく、優秀な人間の研究者は、ベースとなるlogKowを知れば、他の抽出溶媒を使ったときの傾向は見当がつきます。 それは、絶対的な

超臨界抽出:

Oct-DEE

辛いのはどれでしょう?

唐辛子の赤色はパプリカ色素として、食品の着色に使われます。
色素にカプサイシンが残ると辛いです。
色素は加熱すると変色します。

そのようなものは超臨界二酸化炭素で抽出するという手が使えます。

Oct-DEE

株)ILSHINオートクレーブのホームページにどうのようなものに適用できるかよくまとまっています。
しかしこれだけでは、どのような構造のものが、定量的にどれだけ抽出できるかは分かりません。

この定量性に注目して超臨界二酸化炭素抽出を見てみましょう。

東北大学多元物質科学研究所が理論計算の結果と溶解性をQSARした結果を、熱物性 21 No3(2007) p137-142に投稿しています。

Oct-DEE

分極率指数、分子軌道の塩基性度、静電的塩基性度、静電的酸性度から溶解性を推算する式を構築しています。
この方法は、最近のMaterials Informaticsの走りのようなやり方です。

分子軌道法を使えば、どんな化合物でも計算できます。
そして、溶解度という目的変数に対して、説明変数を用意することができます。
目的変数と説明変数の関係をDeep Learningすれば中身はブラックボックスでも予測モデルを作ることができます。

実際に大学の特許をトレースしてみてもMOの計算値と溶解性の間には明確な相関はありません。

多くの論文でマテリアルズ ・インフォマティクス を分子軌道法と組み合わせてやっているのを見かけます。
しかし、こうした各々に相関の無いものを組み合わせてモデルを作った場合には、データが増えてくると合わないものが出て来ます。そしてモデルを作り直す、の繰り返しになります。

ここでは、YMBで計算してみましょう。
下記のデータにあるSmilesの構造式を使ってYMBの計算値をまとめてください。

超臨界抽出データ

Hcode name CAS No. Smiles 308K 14MPa
1121 hexachloroethane 67-72-1 ClC(Cl)(Cl)C(Cl)(Cl)Cl -4.002
530 naphthalen 91-20-3 C12=CC=CC=C1C=CC=C2 -4.271
6-Methoxy-1-tetralone 1078-19-9 COC1=CC2=C(C=C1)C(=O)CCC2 -5.213
831 indole 120-72-9 C1(C=CC=C2)=C2NC=C1 -5.343
7700 2,7-dimethylnaphthalene 582-16-1 CC(C=C2)=CC1=C2C=CC(C)=C1 -5.412
7699 2,6-dimethylnaphthalene 581-42-0 CC2=CC1=CC=C(C)C=C1C=C2 -5.798
54 benzoic acid 65-85-0 OC(C1=CC=CC=C1)=O -6.365
564 phthalic anhydride 85-44-9 O=C(O2)C1=CC=CC=C1C2=O -6.444
20481 5-methoxy-1H-indole 1006-94-6 COC1=CC2=C(C=C1)NC=C2 -6.491
896 1-Naphthol 90-15-3 OC2=CC=CC1=CC=CC=C12 -6.733
9041 2-naphthol 135-19-3 OC2=CC1=CC=CC=C1C=C2 -7.728
1204 salicylic acid 69-72-7 OC1=CC=CC=C1C(O)=O -8.369
20483 1H-indol-5-ol 1953-54-4 C1=CC2=C(C=CN2)C=C1O -9.08
9453 O-AMINOBENZOIC ACID 118-92-3 OC(C1=CC=CC=C1N)=O -9.294
20484 1H-indol-5-amine 5192-03-0 C1=CC2=C(C=CN2)C=C1N -9.408
5441 anthracene 120-12-7 C12=CC=CC=C1C=C3C(C=CC=C3)=C2 -9.807
20485 1H-indole-3-carbaldehyde 487-89-8 C1=CC=C2C(=C1)C(=CN2)C=O -11.41
22028 2-aminopyrazine 5049-61-6 C1=CN=C(C=N1)N -6.47
21921 2-chloropyrimidine 1722-12-9 C1=CN=C(N=C1)Cl -4.066
5467 eicosanol 629-96-9 CCCCCCCCCCCCCCCCCCCCO -8.643
877 fluorene 86-73-7 C1(C=CC=C3)=C3CC2=C1C=CC=C2 -6.442
4-hydroxypyrimidine 51953-17-4 C1=CN=CNC1=O -8.94
22095 2-mercaptopyrimidine 1450-85-7 C1=CNC(=S)N=C1 -9.961
m-methoxyphenylacetic acid 1798-09-0 COC1=CC=CC(=C1)CC(=O)O -6.811
o-methoxyphenylacetic acid 93-25-4 COC1=CC=CC=C1CC(=O)O -9.218
16824 p-methoxyphenylacetic acid 104-01-8 C1=C(C=CC(=C1)CC(=O)O)OC -8.243
9775 methyl-m-nitrobenzoate 618-95-1 COC(=O)C1=CC(=CC=C1)[N+](=O)[O-] -4.616
9776 methyl-o-nitrobenzoate 606-27-9 O=C(OC)C1=CC=CC=C1[N+]([O-])=O -3.804
7758 dibenzofuran 132-64-9 C13=C(C=CC=C3)OC2=C1C=CC=C2 -5.575
7320 myristic acid 544-63-8 O=C(O)CCCCCCCCCCCCC -5.929
11487 octacosane 630-02-4 CCCCCCCCCCCCCCCCCCCCCCCCCCCC -9.566
545 oleic acid 112-80-1 O=C(O)CCCCCCCC([H])=C(CCCCCCCC)[H] -6.615
7331 palmitic acid 57-10-3 CCCCCCCCCCCCCCCC(O)=O -7.924
9128 phenylacetic acid 103-82-2 OC(CC1=CC=CC=C1)=O -5.22
20452 progesterone 57-83-0 CC(=O)C1CCC2C1(CCC3C2CCC4=CC(=O)CCC34C)C -8.394
7769 pyrene 129-00-0 C1(C=CC3=CC=C4)=CC=CC2=CC=C4C3=C12 -8.94
832 skatol 83-34-1 CC1=CNC2=C1C=CC=C2 -5.86
1162 vanillin 121-33-5 OC1=CC=C(C([H])=O)C=C1OC -6.224
5332 2,5-xylenol 95-87-4 OC1=CC(C)=CC=C1C -4.729
850 3,4-xylenol 95-65-8 CC1=C(C=C(C=C1)O)C -5.057
868 biphenyl 92-52-4 C1(C2=CC=CC=C2)=CC=CC=C1 -4.566
876 diphenylmethane 101-81-5 C1(CC2=CC=CC=C2)=CC=CC=C1 -3.55
7725 bibenzyl 103-29-7 C1(CCC2=CC=CC=C2)=CC=CC=C1 -3.838
500 1-methylnaphthalene 90-12-0 CC1=C(C=CC=C2)C2=CC=C1 -3.628
5424 2-methylnaphthalene 91-57-6 CC1=CC(C=CC=C2)=C2C=C1 -3.565
1200 Caffeine 58-08-2 O=C(N(C)C2=C1N(C)C=N2)N(C)C1=O
1198 Nicotine 54-11-5 CN1[C@@H](C2=CC=CN=C2)CCC1
17337 capsaicin 404-86-4 O=C(NCc1cc(OC)c(O)cc1)CCCC/C=C/C(C)C

YSBで変数選択を行うと、必ず融点を変数の一つに選択します。
それは下図に示すように融点と溶解度が非常に高い相関を持っているからです。融点は熱振動が分子間力に打ち勝って液体になる温度ですので、超臨界CO2の運動エネルギーが勝った場合に溶けると考えると合理的な気がします。

Oct-DEE

しかし、それが正しいとしますと、カプサイシンの溶解度は-19.48となり、ほとんど溶解しない事になり現実と合いません。そこで融点のカラムを消去し変数選択を行います。
選択する変数の数を変えたり系列の種類を変えたりしながら複数のモデル式を作ってみましょう。
(例えば、HSP関連の説明変数だけから作る。臨界定数絡みで作る。logKowや関連の説明変数から作る。)

Oct-DEE

一例ととして、
モデル式= A*密度 +B*HansendD -C*表面張力 -D
YSBを用いてA-Dの変数を求めてみましょう。

このモデル式を用いてカプサイシンを計算すると、-4.84となり一連の化合物の中でも非常に高い抽出となる事が予測される。
密度に関してはPirikaのこちらの記事を参照の事。
表面張力に関してはPirikaのこちらの記事を参照の事

対応するブラウザーを使い、上のキャンバスに分子を描けばどのくらいの溶解度かを得る事ができます。 詳しい分子の描き方はこちらを参照してください

このように、一旦モデル式が作成できれば容易に新しい溶質を使った時の溶解度を推算できるようになります。
しかし、コンピュータだけに頼らず”何故”を考えるのは非常に重要です。

このモデル式の中で一番寄与の高いのが表面張力です。
表面張力と溶解度をプロットしてみましょう。

YSBの変数選択は相関係数の高さに注目して行われるので、注意が必要です。

特に今回の融点は自分も危うくだまされる所でした。逆に言えばYMBの出す答えが何故、相関係数が高いのかを考える事は新しい閃きに通じる事もああります。

こうして得られたモデル式は、複雑な理論計算した式と比べても遜色無いものでした。

さらにデータを拡充して検討を加えた所、この表面張力が溶解性をコントロールしているその本質は、マランゴニ対流ではないか? と考えています。(2013.8.21)


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirka]で始めてください。