HSPiPにQSAR機能なんてあったの? 2周遅れ?

今更そんなこと言い出すユーザーがいた。日本語版e-Book(ver.5.3用)を購入して使い方を学んだらどうだろうか?(日本語版Visual How to Use ver.5.3にも付属している。)
日本の研究は生産性が低い。こうしたQSAR機能を搭載しても、英語のe-BookやHow to useは読みもしない。それなら日本語e-Bookをpirika.comから購入すれば良さそうなものだが、販売を始めてから、まだ4セットしか購入はない。

英語をそのまま読む海外との研究者との差は開く一方だろうな。

QSAR機能は流石に、作成してから7年も経つと古い。
このところブログに書いた、皮膚透過や経口吸収を準備中の新しいY-MBやGROVE解析ツールで計算すると、以前のものとは結果が異なる。
ED(Electron Donor)やEA(Electron Acceptor)は現行のバージョンでは計算しない。
従って、QSARモデルの中にそれらが入ることは無い。

最新のY-MBの出力を使ってQSARモデルを構築すると次の様になる。
皮膚透過:
選ばれた記述子:δP(ハンセンの分極項),ED(Electron Donor), EA(Electron Acceptor), log BCF(Bio Concentration Factor)

このlog 生物濃縮性(BCF)もY-MBの新規推算項目で、現行のバージョンでは計算しない。

ここに濃縮されるのか?

経口吸収:
選ばれた記述子:δP(ハンセンの分極項),ED(Electron Donor), EA(Electron Acceptor),分子体積

選択される記述子が変わるだけではない。
GROVE解析ツールは現行の重回帰法とは全く異なる動作を行う。

左の図は、通常の重回帰法でクロスターム=1で計算したものだ。
% Oral absorption = 4.9789*δP+0.3609*ED-1.2286*EA+0.3099*logBCF-0.040116*δP*logBCF+52.6939
となる。
右のGROVE解析ツールで計算したところ、回帰式は次の様になる。
% Oral absorption =5.3668*δP+0.8578*ED-0.9192*EA+0.5155*logBCF-0.05715*δP*logBCF+1.4E-35

式の形は全く同じだが、係数が少し異なることに気がつくだろう。

これは、重回帰計算をした事がある研究者にとっては不思議に思うかもしれない。
重回帰計算を逆行列を求める方法であれば、重回帰計算の答えは一つになる。

数学的にはそれが正しいのだろうけど、GROVE解析ツールは、Y=Xの直線によく乗るものは、どんどん線に乗せ、外れるものは大きく外れても気にしないように動作する。

そこで、R2(決定係数)的には重回帰法よりも悪くなる。
この特徴は、実験誤差を含む系の解析には必須の機能になる。

このバージョンがリリースされると、日本の研究者は2周遅れになる。

まー、社会人の研究者には、何もできないが、せめてpirikaの研究会に参加している学生にはきっちり教えていこうと思う。