2017年はハンセン溶解度パラメータの50周年の記念の年だった。イギリスのYorkで記念講演会が行われ、そこで私は基調講演を2つ行った。
目玉は、Hansen-Hiroshi-Steven Solubility Parameters for PredictionでHSSPP, HSP2だ。今後50周年の二乗でで2500年使われたらいいなと言う希望も込めて。
新しいネーミングもいろいろ考えた。
例えば、Expanded HSP:
でも、EHSPだと、ネットで探そうと思っても見つからなくなる。
English for High School Preparation
Enhanced High Speed Processor
Equine Health Studies Programなどがあるからだ。前に何かをつけるのはよくない。
Keep brand identity of “HSP”
Network searchable.
Image of new and powerfulness.
が大事なので、HSP2とつけたと説明した。
同じ、50周年講演会で、ドイツのLerche先生が、特に無機物の分散にHSPを使っていた。無機物は「溶解しない」のでこれは「分散」だから、Hansen Dispersion Parameters (HDP)が正しいと言い出した。
ハンセン先生は、すかさず、僕は50年前から塗料に使っていたので、昔から溶けてはいなくてもSolubilityなんだと反論していたが。。。
前振りは長いが、実は、ネットを調べていたら、
MSサイエンティフィック株式会社というところが、
ハンセン分散性パラメーター(Hansen Dispersibility Parameter, HDP)は、微粒子やナノ粒子の溶媒に対する親和性や分散性を示す指標です。様々な溶媒への溶解性・分散性を予測し、コーティング業界や表面科学等、さまざまな科学分野で広く使用されています。ハンセンパラメーターを用いることで、スラリー作製時の適切な分散溶剤の選定や設計等に活用できる為、特に注目されている特性評価手法です。
と、ドイツのLerche先生の分散性評価・粒子径分布測定装置LUMiSizerを使って評価サービスを始めていた。
でも、HSPもハンセン溶解度パラメータという文字も使っていないので、今までの私の検索では引っかかって来なかった。
LUM GmbHと我々(ハンセン先生、アボット先生、私)は良い関係なので、なんともまー、もったいない事だ。
そこで、ちょっと彼らの宣伝をしておこう。
彼らの装置、LUMiSizerは無機物の分散評価を行う装置としては非常に優れている。今回、その装置を用いると得られるデータが入手できたので、少し解析を行ってみた。
この装置を使うと、例えばある顔料を14種類の溶媒に対して分散させたものから、Sedimentation time(沈降時間)が得られる。ある溶媒では、すぐに沈降するのであるが、ある溶媒では沈降が遅くなる。そして、それを相対沈降時間(RST)にして(どうやって?)、RST norm >0.5を良溶媒、<0.5を貧溶媒として、HSPiPで解析を行うと、顔料のHSPとハンセンの溶解球が得られると記載してある。
これは、今までのHSPの標準的な使い方だし、書いてあることが間違いだとは言わない。
でも、HSP2を使うともっともっとHSPが豊かにる。
ドイツの、Lerche先生には来日した時にお会いして、それを説明したのだが、あまりちゃんと伝わっていなかったようだ。
例えば、溶媒のED(Electron Donar)とEA(Electron Acceptor)の値は、塩基性顔料、酸性顔料の分散を評価する時には必須になる。dHacid, dHbaseも重要だ。HSP2ではdDもdDvdwとdDfgに分割している。つまり、1つの溶媒に対して、7種類のパラメータがあることになる。
この計算方法はまだHSPiPに搭載されていないので、今回使ったデータはコピーしてエクセルなどに貼り付けて使って欲しい。
このように次元数が高くなってしまうと、これまでのハンセンの溶解球のように3次元表示できなくなるのが最大の問題だ。
そこで、今回は主成分分析(PCA)法を用いて次元圧縮する方法を試してみよう。
PCA法は、軸(Axis)を変換(Transformation)するのでAXになる。
これまでに、
CX(Chemical Transformation)
BX(Bio Transformation)と来たので、今度はAXだ。
主成分分析(PCA)
日本の訪問者はpirikaのPCAのページも合わせて参照して頂きたい。
例えば、左の図では2次元のベクトルが5つある。
ベクトルの大きさは異なるが、向きは非常に似ている。
そこで、X軸、Y軸を回転してあげると右のようになる。
X’軸はだいたい元のベクトルの大きさとなり、Y’軸は非常に小さな値になる。 Y’の値が十分小さければ、軸の回転によって2次元ベクトルを1次元ベクトルに下げたことになる。
このように、まずベクトルの一番大きな傾向を第一主成分、それに直交する軸を第二主成分のように取っていく。
このように書くと簡単に見えることも、いざやってみようと思うと、どうやったらいいか全くわからないだろう。
大丈夫!。今の時代、意味不明でもデータのセットの仕方を学べば、後はボタンポチでPCAなど計算してくれる。統計やら解析などはAIとの親和性が高いので、そのうちデータ・サイエンティストなど必要なくなる。
データセットと結果の受け取り方を学ぼう!。
いきなり7次元のデータを解析するのは大変なのでカラムを二つ選んでみる。
どのような列を選ぶかと言えば、沈降速度との相関が高そうなものを選んでみよう。
先程作成したエクセルのテーブルに新しいTabを付け加えて、一列目にAbbre、2列目に沈降時間、3列目にdP,4列目にEDを抜き出したテーブルを作成してグラフを書いてみよう。沈降速度が500以上のものをオレンジ色で示してある。
このグラフから明らかなように、沈降速度はそれぞれ、dP, EDと高い相関がある。また、2-3点の例外はあるけど、沈降速度が大きい溶媒は、dP, EDが大きい事がわかる。
そこで、dP, EDの関係をグラフに書いてみると、下図左のように高い相関がある。
つまり、各点を表す[dP, ED]ベクトルは、大きさはともかく、向きはよく似ていることになる。そこで右上の新しい赤い軸が求まれば良いことになる。右下の図のように、この場合は、第二主成分も最大15ぐらいの値を持ってしまう。
さー、グジャグジャ説明はとにかく、ポチしよう。
新しいタブが開かれるので、ReadDataとしてCalc.PCAとすると、答えが帰ってくる。
この結果から、第一主成分だけでは86.99%しか表現できていない事がわかる。
そして大事なのが、Calculate Schemeの式だ。この式をコピーして、エクセルの適当な列の2行目に=符号をつけてペーストする。(何故2行目なのかは、2行目のC列、D列を参照する式になっているからだ。)これが新しい軸のX座標になる。
同じように2番目の式を貼り付ける。これが新しい軸のY座標になる。これをプロットすると右下の図が得られる。
これがわかれば、後は、7次元のデータに適用するだけだ。これを第3主成分まで考慮に入れると、92%まで表現できている。
とは言っても、この三枚のグラフから、3次元の位置を頭の中で構築するは無理だろう。
plotly.jsというグラフ作成ソフトを使って3次元で表示してみよう。
これが、HSP2での新しいハンセン空間になる。
オレンジで表示される溶媒を全て球の内側に含むハンセン2溶解球を求めれば、その球の内側に入る溶媒は、皆、沈降速度が500以上であると予測される。
このハンセンの溶解球や軸には、dHacid, dHbase, ED, EAの値も組み込まれている。
もう少し定量的な解析をするなら、我々が作成した、GROVE解析ツールを使う。
HSP2の7つの変数から重要な変数を3つ選択して、沈降速度の予測式を作成する。
沈降速度=-173.54*dHAcid+13.23*ED+75.12*EA+-109.98
となる。4変数を選択するなら、さらにdDvdwが選ばれる。
つまり、この顔料の沈降速度は、dHAcid(水素結合酸性項)、ED(電子供与性)、EA(電子受容性)に大きく依存していることになる。それは定性的にはPCAの軸への貢献度を見ればわかる。
この事を無視して、古い3次元HSPだけから予測した、「さらに分散性を高める溶媒」は、重要度が低い可能性がある事を覚えておくと良い。
今のように、機械翻訳が進んで来ると、Lerche先生も僕の言いたかったことを理解してくれるに違いない。pirikaのDXはこのように、解釈を豊かにすることを目指している。
ちなみに、このブログを読んだAbbott先生は、PCA-Sphereの概念をとても気に入ってくれて、HSPiP ver.6に組み込む事を決定した。古いやり方をしたい研究者はそのまま、ラジオボタンを選択したらPCA-Sphereと切り替えられるようにする予定だ。