Smiles線形表記法について

2022.9.6改訂(2010.2.19)

解析例トップ
 HSP基礎トップページ

HSPiPでは分子の構造をSmiles(Simplified Molecular Input Line Entry Syntax)かMolファイルを使って入力する。(Molファイルは時々結合情報がなかったりして認識に失敗したりする。)

このSMILES方法のメリットはアスキー文字列の小さなサイズでコンピュータが理解できるように分子を表記できる事だ。

詳しくはDaylightのホームページを参照して欲しい。
簡単に説明すると、

Smilesの分子構造式の簡単な説明

  • 分子の水素は書かずに重原子の元素記号だけ線形に表記する。
  • 有機化学用のC, N, O, P, S, F, Br, Cl, Iは角括弧は省略。他の原子には[]をつける。
  • 枝分かれは()を使う。
  • 2重結合は=,3重結合は#で表す。
  • 環状構造は環の結合を一つ切りその両端に1以上の同じ数字をつける。

さらに、

  • 2分子を扱う時にはピリオドで結合する。
  • チャージを扱う時には[]の中に原子を書き+、ーをつける。
  • 共役構造は小文字で表す方法もある。

など細かい規則がある。
有料,無償の分子描画ソフトがあるので探してみていただきたい。

フリー・ソフト

2020年の段階で最も優れたフリー・ソフトはJSMEであろう。ブラウザー上で動作するJavascriptのプログラムで、非常に多くのサイトで使われている。ダウンロードしてローカルで使う分には、構造データの漏洩もない。

著者に許可をいただいて、HSPiPに同梱してあるので是非使って欲しい。

pirikaのwebページにも置いてあるから試しに使ってみるのも良いだろう。

JSME

分子を描いてSmilesアイコンをクリックすると、Smilesの構造式が得られるので、それをコピーする。

JSME
jchempaint

そして色々な構造を描いて、エクセルの表の中に入れておく。
構造式を表計算ソフトのセルに入れ込めるので非常に便利になる。

以下 古い記述:

フリーのソフトで一番のおすすめは、jchempaintだ。
現在ver.3.0.1がダウンロードできるのでインターネットで探してみていただきたい。
これはJAVAのアプリケーションソフトなので、企業の一部では動かす事ができないかもしれない。

(ファイル交換ソフトを規制するためJAVAのアプリケーションを走らせる事を禁止している会社がある。)

このソフトを立ち上げて、TextFieldにSmilesの式を入れて、Insertボタンを押すと2次元の分子構造が描画される。

(実際に複雑な化合物のSmilesを入れてみたら結構失敗する。Smilesから2次元構造の描画はまだまだ難しいようである。)

また、分子構造を描いてから、Editメニュー、Copy As Smilesを選べば、Smilesの式がコピーされるのでそれをエクセルに貼付けることができる。

JChemPaintで普通にCopyをするとMOLファイルのフォーマットでコピーされる。

CDK 2/19/10,11:35
6 5 0 0 0 0 0 0 0 0999 V2000
0.0000 0.0000 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
0.0000 1.5000 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-1.2990 2.2500 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
1.2990 2.2500 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.2990 -0.7500 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.2990 -2.2500 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
2 1 1 0 0 0 0
3 2 2 0 0 0 0
4 2 1 0 0 0 0
1 5 1 0 0 0 0
5 6 1 0 0 0 0
M END

この両方ともHSPiPで受け付けてくれるの便利であるが、エクセルを使って管理すという意味ではSmilesが適している。

そして色々な構造を描いて、エクセルの表の中に入れておく。

自作のソフト

対応するブラウザーをお使いなら、上のキャンバスに分子を描けばSmilesを得る事ができる。
詳しい分子の描き方はこちらを参照して欲しい

古いアプリは処分してしまおうと思ったら、polymer Smilesの関係で残さなくてはならないようだ。

そして、HSPiPを立ち上げて、δ(DIY)ボタンを押すと上のようなDIY(Do It Yourself)パネルが立ち上がる。

その一番左のY-MBタブを選びSmilesをペーストして、右上の電卓マークを押す。

すると分子を原子団に分解し様々な物性値を計算する。
(バージョンによって、タイトルをつけるか、フル・データを出力するかのテックボックスがある)

そして計算値はクリップボードに入っているので、それをそのままエクセルにペーストすることができる。

また、その時に原子団の種類と数から、データベースを探索して、この化合物のHcode(Hansen Code)は7でアセトンとマッチする事、そして計算値ではなくオフィシャルなHSP値として[15.5, 10.4, 7]である事が表示される。

原子団の種類によっては、複数の候補がありうるのでこの値はコピーされないが、正しく認識されているようなら値を控えておくと良い。

このようにして得られた、HSP値や物性値を使って次の評価が進められるので非常に便利だ。
(GUIはバージョンによって異なる。)

ポリマー Smiles

同じ事が、ポリマーに対しても行える。

HSPiPではポリマーのSmilesは少し拡張した形で、ポリマーの繰り返し単位をダミーアトム(X)でくくる

例えばポリエチレンはXCCX, ポリプロピレンはXCC(C)Xのようにする。
エステル基などはXをまたいで記述してはいけない。

◎ XCCC(=O)OX
× XOCCC(=O)X

ダミーアトムをまたいでしまうと、エーテルとケトンと認識されてしまう。

jchempaintを用いてポリマーSmilesを書くには、Xはサポートされていないので、自分が使わない、例えばヨウ素(I)でターミネートしておき、Smilesを得てから、IをXに変える。

JSMEであれば[X]をサポートしているが、Xを両末端には持っていってくれない。

Xが両末端にないと困るのが、共重合体やポリエステルやウレタンなどの設計だ。

XAX と XBXがあれば、XA_XX_BX XABXが簡単に作れる。

XAAAX XBBBXでも同じだ。

一旦、polymer-smilesが得られれば、後は溶媒などと同じである。

PolymerSMILES

DIY のpolymer tabでテキストフィールドにpolymer-smilesを入れて計算すれば良い。

このpolymer smilesと合致するポリマーの候補が表示される。
計算ができるとDIYのY-MBタブには分子模型も出力されている。

PolyYMB

このpolymer-smilesを使うメリットは、エクセルでポリマー物性値とHSP関連推算値を同時に扱える事だが、自分としては一番のメリットは先ほどの溶媒と同様、分解された原子団によって、ポリマーの候補がデータベースから検索される事だ。

ポリマーの名称はやっかいで、名称で検索しても大抵失敗する。
CAS#のような指標も実は余り意味が無い。 古い記述

まだ、developer versionにしか搭載されていないが、polymer-smilesを入力してbreakすると、ポリマーを主鎖部分と側鎖部分に分けて数を考え、HSPを計算し、また1200件のポリマーデータベースから候補を探し出すことができる。
(実はこの機能なしにポリマーのデータベースを作るのはほとんど不可能であった。)

共重合など組成の違いは無視して、入っているものだけでpolymer-smilesを記述しておけば、同じものが入っているものは検索できる。
組成比は別に管理すれば良い。

このようにSmilesの技術はHSPiPの中で非常に重要な位置を占めている。

お手元の、化合物、医薬品、香料、ポリマーのsmilesをお持ちなら、HSPiPはすぐにその威力を発揮できると私たちは考えている。データベースのインポートの記事を参考にして欲しい。

2012.1.16

HSPiPでポリマーのSmilesを使うにはポリマーの繰り返し末端Xを両脇に持ってこないとならない。それを手作業でやるのは非常に大変だというメールを頂いた。JAVAのプログラムであるが、こちらに[Xを自動的に両脇に持ってくるプログラム]()がこちらに置いてあるので利用して頂きたい。非常に簡単にできるようになったとご返事を頂いた。

JAVA版は動かないが上記の自作ソフトでは、分子を描いてPo(ポリマー末端)を指定すると自動的に両末端に配置する。

解析例トップ
 HSP基礎トップページ


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください)
メールの件名は[pirika]で始めてください

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です