分子本人の責任ではなく、そもそも、自然界にあまり存在しないので、人類が接触するチャンスがなかった為、皮膚が異物だと差別しているなら、どんな分子の記述子持ってきても合うはずがない。
って話を前回書いた。
すぐにツッコミで、「なら、Materials Informaticsなんてできやしない」などと言う、嫌な奴がいる。
pirikaのブログは自分のブログなので、好きに言い返せる。
(反対意見は載せなければいいので、やりたい放題だ。)
人間には、その時代、その地域で食べてきた食べ物がある。
エステル化合物は基本食料に含まれるので、あまり毒性化合物は多くない。
LD50が2000以下になるものはAllyl Acetateぐらいで余り毒性はない。だから基本余り皮膚刺激性もない。
エステル化合物がお腹の中で加水分解されてできる、カルボン酸やアルコールも、消化して死んでしまっては困るので余り毒性は高くない。
面白いのが、1級アルコールで毒性が一番高いのは、C7ぐらいだということだ。
logKowというオクタノール/水分配比率の測定につかわれるアルコールは、アルコールのなかで、毒性が高いもの、そのくらいの極性に分配しやすいものは体に良くないのかとか考えるネタになる。
カルボン酸もLD50が2000以下なのは蟻酸ぐらいだ。
例外は、2重結合に官能基がついたものは毒性が高い。
分子が大きいものは吸収できないのか毒性は低い。
リピンスキーの「ルール・オブ・ファイブ」というのがある。
- 水素結合ドナー(OH, NH)が5個以下である。
- 水素結合アクセプター(N, Oなど)が10個以下である。
- オクタノール-水 分配係数(LogP)が5以下である。
- 分子量が500以下である。
この範囲を外れるものは毒にも薬にもならない。
前振りが長かったが、前のブログである。
「分子本人の責任ではなく、そもそも、自然界にあまり存在しないので、人類が接触するチャンスがなかった為、皮膚が異物だと差別しているなら、どんな分子の記述子持ってきても合うはずがない。」
こういう非科学的なことを機械学習に入れるのは世界で初めてだろう。
自然界に余り存在しないものは、高価である。
そこで、リピンスキーの「ルール・オブ・ファイブ」に追加する項目として、500gあたりの値段が5000円以上かどうかを提案しよう。
Compound | CAS | 単位 | 円 | Positive rate (%) | |
Isopropyl palmitate | 142-91-6 | 500ML | 3,500 | 東京化成 | 0 |
Butyl benzoate | 136-60-7 | 500ML | 3,700 | 東京化成 | 0 |
Heptyl butyrate | 5870-93-9 | 1 kg | 16200 | アルドリッチ | 0 |
Methyl laurate | 111-82-0 | 500ML | 5,000 | 東京化成 | 0 |
Isopropyl myristate | 110-27-0 | 500ML | 5,100 | 東京化成 | 3.3 |
Methyl caproate | 106-70-7 | 500mL | 6800 | 東京化成 | 0 |
Methyl palmitate | 112-39-0 | 5G | 12,300 | 東京化成 | 3.4 |
Benzyl salicylate | 118-58-1 | 500G | 7,000 | 東京化成 | 0 |
Linalyl acetate | 115-95-7 | 500ML | 11,800 | 東京化成 | 3.2 |
Hexyl salicylate | 6259-76-3 | 250ml | 8420 | アルドリッチ | 0 |
もちろん、今の円安では5000円というのも余り意味がないが。
そこは、リピンスキーに敬意を払って。
確かに値段の高い2つは皮膚刺激性があるね。
まー、このように、機械学習の入力値なんて、試薬の値段を入れても合う時には合う。
試薬が記載されているカタログのページ番号だって良いかもしれない。
そこから何を読み解くかが大事なのであって、ブラックボックスを得るのが目的ではない。
MOの計算値値やら、MDの計算値とか言っている論文を見ると、試薬の値段とか言い出したくなる、ひねくれ者の戯言ではあるが。