HSPiP用の入力データ作成

2024.9.29

解析例トップ
 HSP基礎トップページ

HSPiP用のデータ作成

HSPiPの入力データは、最初は拡張子はssdが使われていた。
単なる、タブ区切りのデータであった。
その後、hsd(Hansen Solubility Data)フォーマットになり、さらにver.5.3まではhsdxというxmlフォーマットが併用されたが、現在ではtab区切りのデータはHSPiPでは利用できない。

HSPiP用のデータを作成するのは大変

私はMacユーザーなのでHSPiPを使ってデータを作成することはない。
とんでもなくデータ作成は面倒であるが、Abbott先生は元に戻す気は無いようだ。
基本的なデータ作成の方法を示そう。
まずは次のようなデータがあるとしよう。


様々な溶媒に対して、その溶媒があるポリマーを溶解(S)したか(無機物を分散したか)のデータを集める。その際に溶媒のCAS番号を詰めておくと良い。
(現在は私はChatGPTにCAS番号を調べてもらう)
こうしたテーブルが準備できたら、HSPiPを使って次のようにデータを作る。

CAS番号から検索を行って、そのデータをメインテーブルに送る。それを繰り返してテーブルを埋める。
その後、Scoreを入力する。
Scoreには例えば、溶解度の実数が入ることもある。そのような場合でも、1つ1つ手入力するしなくてはならない。
場合によっては、溶解(1)と不溶(0)の値を変えたり、溶解もランクで1-6で入力したりする。実数の場合にはlogをとったり、逆数をとることもある。
その度にHSPiPでデータを作るのは現実的ではない。
Abbott先生のように特殊な才能を持った人にだけできる事だろう。

古いバージョンを残しておく

ver. 5.3を残しておけば、tab区切りのtxtファイルを、拡張子hsdに変えればHSPiPで読み込むことができる。それをhsdxとしてセーブすれば今後も使える。
windows10用のver. 5.3がいつまで動くは私にはわからない。でも、多分文大丈夫のような気がする。保証はしないが。

コンバータを作ってしまう

TabデータはHSPiPを使って作成しておく必要がある。

メインテーブルができたら、Copy to Clipboardコマンドを使ってClipboardにコピーし、その後はデータはExcelで扱う。
元のメインテーブルが作成されていれば、後はScoreを自由に変更できる。

上のテーブルを自由にxmlフォーマットのhsdxに変換できるなら入力データの生産性はとても高くなる。
そのようなコンバーターを作るのはとても簡単なことだ。
企業の研究ではデータの漏洩の問題があるので、自作することをお勧めする。
次のWebアプリは機密情報は扱わない方がいいです。NDAを結んでいる所には社内LANの外に出ないバージョンを提供している。


HSDのデータをExcelからペーストして変換し、結果をテキストエディターから、拡張子.hsdxでセーブしてみよう。HSPiPから読み込めると思う。
Scoreの部分を自由に変更してHSPiPで計算してみよう。

HSPiPのAutoCheckを使う。

古いTabデータを読み込むときには、必要に応じて、HSPの値と分子体積の値を最新値を更新しよう。


以前にHSPiP用の入力データを作ったのであれば、わざとhspの値を例えば0にしてしまう。それをOpen with AutoCheckで読み込むとCAS番号をチェックしてHSPが変わっていたら(hspが0なので必ず変わっている)オフィシャルのHSP値を使ってテーブルを作成する。

次世代のHSPとその入力データの作成

次世代のHSPのデータフォーマットはHSPiPのものとは完全に異なる。そこで入力データの作成方法も全く新しいものを作成した。

V-Tubeでも説明した
No.11 DXによるHSP用データの生産性向上
No12. 量子ドットのようなナノ粒子のハンセン溶解度パラメータを得る方法

データとしては、CAS番号とScoreを準備する。
Webアプリを使うと、CAS番号からHSPと分子体積をDBを検索してテーブルを作る。
オフィシャルのHSP,分子体積がDBに存在すればそれを、存在しなければ推算値を利用する。CAS番号が登録されていない場合には、同じくWebアプリ、YMB24を使って推算値から入力データを作る。

このWebアプリは次世代HSP用の入力データも作成するが、旧来のhsdxのデータも作成する。さらに、sofx(Solvent Optimizer File)のファイルも作成する。このWebアプリは、Y-MB24Pro4MIに搭載されているが一般公開はしていない。(HSPiPの販売とバッティングするため) 便利に生産性を高めたいなら導入を考えるのも良いだろう。

入力データ

なんにせよ、低分子化合物に関してはCAS番号を集めておくと良い。
CAS番号はExcelで扱う場合、日付に変わることがある。そのようなものは、先頭に”_”がついている。
CAS番号、HCodeをSMILESと変更するWebアプリもY-MB24Pro4MIに搭載してある。

Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください)
メールの件名は[pirika]で始めてください

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です