私はHSPiPというソフトウエアーをデンマークのHansen先生、UKのAbbott先生と開発している。そのソフトウエアーの中のY-MBという物性推算機能は私が責任を持って作っている。
Abbott先生から、USのAI開発会社がSMILESの構造式からHSPを推算するシステムを作ったという連絡を受けた。Abbott先生は彼らとTeamsで話をしたのだけど、10Kデータベースの化合物でR2が0.97であったと言っていたらしい。
私が先生たちと一緒に開発を始めたのが2008年。15年でついにAIが私をコピーするようになったのかと思うと感慨深い。
そんな時代は当然くると、私たちは予測していた。
そこで、共同研究を始めるにあたって、HSPiPのDBには、オフィシャルな値と推算値のどちらが記載されているかわからないようにしてもらった。
オフィシャルな値をそれがわかる形で搭載した場合、もっと大手のソフト会社がより優れた推算式を開発すると、誰もHSPiPを購入してくれなくなる。
我々には、オフィシャルな値を集めるという膨大な作業だけが押し付けられれ、成果は他が取る事になる。
15年前に予測したことがやっと現実になったのだ。
AI開発会社は、HSPiPに搭載されているY-MBの計算結果を再現するように学習したわけだ。
Y-MBでやれば当然、R2が1.0だ。
彼らの開発したのはHSPの推算ではなく、Y-MBの推算結果の推算でR2が0.97だ。
沸点の推算式と異なり、HSPの値は分析では出てこない。(最近はずいぶん良くなってきているけど)
沸点の実験値がたくさん集まれば、自分なりの沸点推算式を作成できる。拡張JOBACK式と呼ぼうが、大学の名前を冠して呼ぼうが自由だろう。
でも、ハンセンの溶解度パラメータはオフィシャル値はHansen先生の書籍に記載されている1200化合物がせいぜいだ。
色々な論文に記載されている値を収集しているがそんなに増えるわけではない。
しかし、書籍の方はバージョンアップしない。
私自身は、HSPiPのデータベースも管理しているので、オフィシャルな値を5000弱持っている。これは推算式を構築する用のデータセットで、HSPIPにも搭載しないし、公開もしていない。
ギリシャ、セサロニキのAristotle大学のPanayiotouら はHansenの溶解度パラメータを推算する推算式を公開している。
なぜ、彼らがその溶解度パラメータをハンセンの溶解度パラメータと呼んで良いのかというと、我々が「ハンセンの溶解度パラメータのオフィシャル値を提供」したからだ。
HSPiPに搭載されているY-MBの計算値を再現するようにいくら頑張ったところで、それはY-MBの推算式を模倣しただけで、HSPの推算式を開発したことにはならない。
15年前にこうなることを予測して、打っておいた布石に、やっと引っかかる会社が現れたということだ。
著作権意識に欠ける相手用のトラップであるが、実は最初にかかったのは日本の大学だ。
関西の方の大学で、関西大学版JKU-HSP法とか言っている。
彼らは、HSPiPのY-MBの計算値を再現できるようにソフトウエアーをクラッキングしている。
今の時代、Y-MBに100万個のSmilesを与えて出てきた結果をAIに学習させれば、冒頭に書いたようにR2が0.97ぐらいで応えてくれるだろう。でもそれは、大学の研究と言えるだろうか?
私が作ったY-MBと同じ答えを返すプログラムを作って、関西大学版JKU-HSP法を作ったと学位論文を書き、博士号を得る。
そんなことを2015年の学位論文から行なっている。
USの会社より8年も早いので偉いが、やっていることは、ソフトのクラッキングと研究の剽窃だ。アカデミック剽窃とはこちらが参考になるだろう。
その大学と共同研究して特許を作成している企業もたくさんいる。
まー、恥をかく前によく見直すことだ。
近いうちにY-MBの新版が出る。
彼らはまたせっせとクラッキングし直すのだろうか?