蛍光ソルバトクロミック色素はどんな色になるか?

ソルバトクロミズム(Wikipedia)というのは、溶媒の極性によって色素の色が変化する事だ。様々な溶媒の極性がET(30)の値としてまとめられている。

そこで、ある色素を生体の中に吸着させた時に、どんな色になるかを見れば、その色素の周りの極性がどのくらいかが見当がつく。

素人の間違いかもしれないが、コロナウイルスのスパイクの部分の極性が蛍光ソルバトクロミック色素の色を見るとわかるという事だろうか?

すると、逆に、ある構造(例えばトリプトファン)があったら、その構造周辺の極性、ET(30)がいくつかなのかを知りたいというニーズもあるかもしれない。

ハンセンの溶解度パラメータ(HSP)を開発している者としては、そんな訳の分からない極性では無く、HSPを使ってくれって言いたい所だ。
そこで、ET(30)という物性値はHSPとどのような関係にあるのか知りたくなる。
アニメーションで見てみよう。

手持ちのDB中でET(30)の値がわかっている化合物は、281化合物ある。その化合物のSmilesの構造式とY-MBを用いて、様々な物性値を計算する。

もともとET(30)は極性を表すパラメータなので、相関をグラフ表示してみれば、HSPのdP(分極項)と相関があるだろうことは予測できる。
その次には、dH(水素結合項)と相関がある。

水素結合項はdHAcidとdHbaseに分割できるのでそれらとの相関があることも容易に知ることができるだろう。

つまり、ET(30)はdP(分極項)とdH(水素結合項)の両方に依存してしまう。そこで変換するにはQSAR式を構築する事になる。

YEDとYEAは私、Yamamotoが作成したED(Electron Donor)性の指標、EA(Electron Acceptor)性の指標だ。元々はGutmannのDN, ANであるがHSPiPの中で使っているdHdo, dHacと混乱するので別に表記している。HSPiPのはプロトン・ドナー/アクセプターだ。

5年前のHSP50周年記念講演会で発表している。
当時はこのYED,YEAをdHやdPに割り振ろうと苦労していた。
それは、HSPの理論では化合物間のHSPの違いをHSP距離で取り扱うためだ。
HSPが全く同じ化合物間ではHSP距離がゼロになる。
同じものが同じものを溶かす以上の溶解性は無いという前提だ。

ところが分子間相互作用の観点で見ると、ドナー/アクセプター相互作用を入れるとHSP距離が負になってしまう事がある。(ルートの中が負になるので計算できない)

つまり、ED(Electron Donor)、EA(Electron Acceptor)はHSP距離に持って行かれないので、現状使っていない。

しかし、MI/MG/MLなどではとても重要なパラメータで重宝する。

今回のET(30)のケースでもYEAとの相関は非常に高いものである事は確認できるだろう。

それでは、こうした最新のY-MB-2021で算出したDescriptors(記述子)と解析用ツールMIRAIを使って、ET(30)の予測式を作るとどうなるかを示しておこう。

通常の解析ソフトでは、自乗誤差を最小にして全てのデータがY=Xの直線になるべくよく乗るように動作する。(MR:Multiple Regression)
すると次のようにET(30)の大きい領域の再現性はとても悪くなる。(ET(30)が50以下になる化合物が圧倒的に多いのでパラメータがそちらに引きずられてしまう。)


MIRAIでは、外れるものはさらに大きく外れても良いので、Y=Xに乗るものはさらによく乗るように動作させている。

すると、大きく外れるもののデータを再チェックを行うことができる。(データのクレンジング)
例えば、Y=Xの下側にくる溶媒にどんなものがあるか調べると、例えば電子吸引性基のついたアルコールがずれている。

2-CyanoethanolOCCC#N
2,2,3,3-Tetrafluoro-1-propanolOCC(F)(F)C(F)F
2,2,2-TrifluoroethanolC(C(F)(F)F)O
1,1,1,3,3,3-hexafluoro-2-propanolC(C(F)(F)F)(C(F)(F)F)O

HSP値やYED,YEA、ダイポールモーメントの計算値をチェックし直すのは当然としても、他の機構を考えるとても良い示唆を与える。

つまり、これらの化合物は、計算から予測されるET(30)よりも実測のET(30)が大きくなっている。もし界面活性剤のように、OH基を内側にしたクラスターを作っているなら集合体として物性になる。
その場合にはずれて当たり前だ。
MI/MG/MLをやっている所は、どうも「ずれて当たり前」の事を無視して相関係数、決定係数の高さだけを追求しているような気がする。

水も下に大きくずれるが、水が13個でクラスターを作っていることはNMRだかで調べられている。

そうした検証をやってくれるような所はどこか無いものだろうか?