SMILES

分子の線形表記法

本来3次元の構造をもつ分子を線形表記する為に考えられた方法です。

Simplified Molecular Input Line Entry Specificationの略です。詳しい説明はこちらでお調べください。

http://clogp.pomona.edu/medchem/chem/SMILES/tutorial.html

簡単に説明しますと、

水素は表示しない。
環状化合物は適当な結合を切って、結合していた原子同士に同じ数字をつける。
枝別れは()でくくって処理する。
2重結合は=で、3重結合は#で表記する。
シス、トランス、光学異性体の表記は参考文献を参照して下さい。

化合物

SMILES

CH3CH2OH

CCO

C1CCCC1

CC(C)CC

C=CCCC

C=CCC#N

OC1=CC=CC=C1

Oc1ccccc1

CH3NO2

C[N+]([O-])=O

芳香族は2重結合で表記する場合と、小文字のcで表記する場合とがあります。
ここでは2重結合で表記する方法を採用しています。

物性推算で分子の入力にSMILES式を使う上で以下の制限があります。(解析ルーチンができていないため。SMILES式自体の制限ではありません。)

  1. 同位体は扱えません。
  2. シス、トランスは区別できません。
  3. 扱える原素は、C,H,N,O,S (ハロゲンは近いうち対応予定)
  4. 芳香族は今の所扱えません。
  5. 原子団の種類によっては解析できないものがあります。
  6. 電荷を持つ化合物は計算できません。
  7. 不安定な化合物は計算できません。

分子構造を書くだけでSMILES式に変換してくれる無料ソフト(CS ChemDraw Net)がインターネットを通じてダウンロードできます。