発がん性化合物のHSP

2010.2.24

解析例トップ
 医薬品・化粧品トップページ
 環境、溶媒設計トップページ

概要

芳香族の多塩素置換体はPCB化合物とも呼ばれ、その非分解性と毒性が問題となっている。
しかし、ある化合物は高い発がん性を示すのに、ある物は発がん性がない。
どのような違いがあるのか、ハンセンの溶解度パラメータと自己組織化ニューラルネットワーク、SOMを使って解析を行った。

また環境関連の物性値の推算精度を検証した。

内容

Poly-chlorinated compounds’ carcinogenicity.

PCBs (polychlorinated biphenyls) に代表されるようなポリー塩素素化化合物の発がん性のデータが J. Comput. Chem. Jpn., Vol. 1, No. 1, p. 23–28 (2002)に記載されていた

この論文では発がん性をニューラルネットワークで、 logP, Gibbs Energy, Ionization Potential, LUMO, HOMO-LUMO Gap and Connolly Volumeという識別子を使って解析している。

認識率は93%となっている。

QSAR(定量的構造活性相関)を使うと、こうした識別子と目的変数の間の関係を解き明かしてくれる。
それは、それで便利であるのだが、例えば、その化合物が記載されている試薬カタログのページ数を入れても相関が高くなることは有りうる。

そこで、どんな識別子で目的変数を表すかは非常に重要である。

分子軌道計算の結果を使った場合には、どんな化合物でも計算できるというメリットはあるが、なんでもかんでもMO計算の結果を入れればいいというもんでもないと思う。

化学、化学工学の分野では、古くから次元解析という手法が取り入れられてきた。

これは目的とする変数の次元が、説明変数から作られる推算式の次元と合うような推算式が正しいという考え方だ。

MO計算の結果を使っても次元は合わない。

NonameCASFormulaCarcino
genicity
1Aldrin309-00-2C12H8Cl6+
2Allyl chloride107-05-1C3H5Cl+
3Benzyl chloride100-44-7C7H7Cl+
4Carbon tetrachloride56-23-5CCl4+
5Chlordane 〈trans,ci〉(γ)12789-03-6C10H6Cl8+
6Chlordane 〈trans,cis〉(α・γ isomers)57-74-9C10H6Cl8+
79-Chloro-10-chloromethyl-anthracene19996-03-3C15H10Cl2+
8Chloroethane75-00-3C2H5Cl+
9Chloroform67-66-3CHCl3+
107-(Chloromethyl)benz[a]anthracene,6325-54-8C19H13Cl+
119-Chloromethyl-10-methyl-anthracene25148-26-9C16H13Cl+
123-Chloro-2-methylpropene563-47-3C4H7Cl+
13p,p’ -DDD72-54-8C14H10Cl4+
14p,p’ -DDE72-55-9C14H8Cl4+
151,4-Dichlorobenzene106-46-7C6H4Cl2+
161,2-Dichloroethane107-06-2C2H4Cl2+
17Dichloromethane75-09-2CH2Cl2+
181,2-Dichloropropane78-87-5C3H6Cl2+
191,3-Dichloropropane142-28-9C3H6Cl2+
20Heptachlor76-44-8C10H5Cl7+
21Hexachlorobenzene118-74-1C6Cl6+
22Hexachloroethane67-72-1C2Cl6+
23Methylallyl chloride513-37-1C4H7Cl+
24Mirex2385-85-5C10Cl12+
25Pentachloroethane76-01-7C2HCl5+
261,1,1,2-Tetrachloroethane630-20-6C2H2Cl4+
271,1,2,2-Tetrachloroethane79-34-5C2H2Cl4+
28Tetrachloroethylene127-18-4C2Cl4+
291,1,2-Trichloroethane79-00-5C2H3Cl3+
30Trichloroethylene79-01-6C2HCl3+
311,2,3-Trichloropropane96-18-4C3H5Cl3+
32Vinyl chloride75-01-4C2H3Cl+
33Chlorobenzene108-90-7C6H5Cl
341-Chlorobutane109-69-3C4H9Cl
35DDT 〈p,p’ -DDT,o,p’ -DDT〉(p,p’ -DDT)50-29-3C14H9Cl5
36DDT 〈p,p’ -DDT,o,p’ -DDT〉(o,p’ -DDT)789-02-6C14H9Cl5
371,2-Dichlorobenzene95-50-1C6H4Cl2
381,1-Dichloroethane75-34-3C2H4Cl2
39Hexachlorocyclopentadiene77-47-4C5Cl6
40Lindane58-89-9C6H6Cl6
41Pentachlorobenzene608-93-5C6HCl5
421,1,1-Trichloroethane71-55-6C2H3Cl3
43Vinylidene chloride75-35-4C2H2Cl2

この分類をHansen Solubility Parameter(HSP)とSOM(Self organization Map)を使って行ってみる。

HSPは溶解度を示すパラメータで、似たHSPのものは似たHSPのものを溶かす。

発がん性物質が細胞膜に溶解する、DNAだかに溶解する。そうした溶解性がなんらか影響を与えているのではないかと解析を行ってみる事にする。

自己組織化ニューラルネットワーク(SOM)に入力するベクトルは、 [dD, dP, dH, Vol/10], の4次元ベクトルを与えた。
SOMは似たベクトルを似た位置に2次元的にマッピングする。詳しい説明はこちらをお読みください

namelogPdDdPdHvol/10
Aldrin3.519.54.72.518.88
Allyl chloride1.63176.22.38.23
Benzyl chloride2.5918.87.12.611.54
Carbon tetrachloride2.4317.800.69.71
Chlordane 〈trans,cis〉(γ)4.219.18.51.720.65
Chlordane 〈trans,cis〉(α・γ isomers)4.219.18.51.720.65
9-Chloro-10-chloromethyl-anthracene5.2320.14.81.820.95
Chloroethane1.315.76.12.97.08
Chloroform1.7117.83.15.78.05
7-(Chloromethyl)benz[a]anthracene5.720.75.81.822.89
9-Chloromethyl-10-methyl-anthracene5.1219.84.32.220.95
3-Chloro-2-methylpropene1.7316.25.629.88
p,p’ -DDD5.7720.25.54.123.53
p,p’ -DDE5.8120.26.53.723.05
1,4-Dichlorobenzene3.1119.75.62.711.74
1,2-Dichloroethane1.59187.44.17.94
Dichloromethane1.08177.37.16.44
1,2-Dichloropropane217.37.12.99.82
1,3-Dichloropropane1.8188.239.57
Heptachlor3.5919.47.22.118.36
Hexachlorobenzene5.3720.32.1016.49
Hexachloroethane3.2118.62014.36
Methylallyl chloride216.17.14.29.56
Mirex6.3319.110.84.89.05
Pentachloroethane2.7118.23.22.412.08
1,1,1,2-Tetrachloroethane2.4184.44.210.95
1,1,2,2-Tetrachloroethane2.2218.85.15.310.58
Tetrachloroethylene2.4218.35.7010.28
1,1,2-Trichloroethane1.918.25.36.89.29
Trichloroethylene2.25183.15.39.01
1,2,3-Trichloropropane2.2917.812.33.410.65
Vinyl chloride1.66166.52.46.47
Chlorobenzene2.54194.3210.21
1-Chlorobutane2.216.25.5210.45
DDT 〈p,p’ -DDT,o,p’ -DDT〉(p,p’ -DDT)6.33205.53.126.88
DDT 〈p,p’ -DDT,o,p’ -DDT〉(o,p’ -DDT)6.33204.42.924.96
1,2-Dichlorobenzene3.1119.26.33.311.3
1,1-Dichloroethane1.4316.57.838.47
Hexachlorocyclopentadiene2.0219.25.10.415.63
Lindane4.218.815.41.520.8
Pentachlorobenzene4.8121.74.3014.84
1,1,1-Trichloroethane2.116.84.329.93
Vinylidene chloride1.8316.45.22.48.04

得られたSOMは上のようになった。

4121.74.3014.84PentachlorobenzeneC6HCl5
3919.25.10.415.63HexachlorocyclopentadieneC5Cl6
33194.3210.21ChlorobenzeneC6H5Cl
4216.84.329.931,1,1-TrichloroethaneC2H3Cl3
3416.25.5210.451-ChlorobutaneC4H9Cl
4316.45.22.48.04Vinylidene chlorideC2H2Cl2
3719.26.33.311.31,2-DichlorobenzeneC6H4Cl2
3816.57.838.471,1-DichloroethaneC2H4Cl2
35205.53.126.88DDT 〈p,p’ -DDT,o,p’ -DDT〉(p,p’ -DDT)C14H9Cl5
36204.42.924.96DDT 〈p,p’ -DDT,o,p’ -DDT〉(o,p’ -DDT)C14H9Cl5
4018.815.41.520.8LindaneC6H6Cl6

35, 36のHSPは非常に良く似ている。
(41,39) (33,42) (42, 34, 43) (37,38) も良く似ている。

なぜ、そのような領域の化合物は発がん性がマイナスなのであろうか?

アンドロステンジオン(Androstenedione)は、副腎、性腺で生産される19炭素のステロイドホルモンで、テストステロン、エストロン、エストラジオールのそれぞれの生合成経路の中間生成物である。

HSP [19.6, 8.6, 3.6] Vol 261.1 推算値

例えば上記のアンドロステンジオンは、人間の活動に必要なステロイドの中間生成物で、これが発がん性であったら生命活動は成り立たない。

この化合物のハンセンの溶解度パラメータのYMB推算値は[19.6, 8.6, 3.6]である。

上のSOMでいうと、オレンジの領域になる。

環境ホルモンのところでも触れるが、こうした生命活動に必須のホルモン・ステロイドが発がん性であるはずがない。

しかし、そこに非常に近い領域(例えばオレンジの領域)18,23の化合物は、もしかすると、アンドロステンジオンと間違って認識されて取り込まれ、しかし、それからテストステロン、エストロン、エストラジオールなどが出来るはずもなく毒性に繋がっているのかもしれない。

その際には、ケトンがアルコールに変換されるときのHOMO-LUMOギャップとかMO計算も入り込んでくるのかもしれない。

このように、最初の文献にあったように、化合物を分子軌道計算する事によって出てくる指標でいきなり発がん性を議論するのではなく、溶解度を指標にしても化合物を分類する事ができるのは非常に興味深い。

逆に言えば、発がん性のある化合物のマップとその平均HSPから、作用機構を考える事も可能になると考えられる。

最新のHSPiP ver. 3.1.x を使ってこれらの多塩素置換体の、生物濃縮性、logP ,logSそして土に対する分配係数の、実験値と推算値の対比をおこなった。

Ver. 3.1.xの推算性能は格段に向上したといえる。

対応するブラウザーをお使いなら、上のキャンバスに分子を描けばlogPがどのくらいかを得る事ができる。詳しい分子の描き方はこちらを参照してください

2010.10,12
NHKスペシャルを見ていたら、抗がん剤で面白いものが開発されているらしい。

その薬はがん細胞の部分の血流をストップさせるらしい。
単純にポリマー屋の観点から見ると、がん細胞と普通の細胞の溶解度パラメータが違っていて、がん細胞に非常に良く溶解して強く膨潤すれば血管が押しつぶされて血流が止まる気がする。

その薬の溶解度パラメータと同じHSPの化学品を投与した時の結果を知りたいものだ。

2012.9.10

Wikiのページを見ていたら、ダイオキシンの毒性当量因子(TFE:toxic equivalency factors)の値が載っていた。

具体的な値があれば、HSPiPを使った解析ももっと容易だ。

namelofTEF
2,3,7,8-TCDD0.000
1,2,3,7,8-PeCDD0.000
1,2,3,4,7,8-HxCDD-1.000
1,2,3,6,7,8-HxCDD-1.000
1,2,3,7,8,9-HxCDD-1.000
1,2,3,4,6,7,8-HpCDD-2.000
OCDD-3.523
2,3,7,8-TCDF-1.000
1,2,3,7,8-PeCDF-1.523
2,3,4,7,8-PeCDF-0.523
1,2,3,4,7,8-HxCDF-1.000
1,2,3,6,7,8-HxCDF-1.000
1,2,3,7,8,9-HxCDF-1.000
2,3,4,6,7,8-HxCDF-1.000
1,2,3,4,6,7,8-HpCDF-2.000
1,2,3,4,7,8,9-HpCDF-2.000
OCDF-3.523
3,3′,4,4′-TCB (77)-4.000
3,4,4′,5-TCB (81)-3.523
2,3,3′,4,4′-PeCB (105)-4.523
2,3,4,4′,5-PeCB (114)-4.523
2,3′,4,4′,5-PeCB (118)-4.523
2′,3,4,4′,5-PeCB (123)-4.523
2,3,3′,4,4′,5-HxCB (156)-4.523
2,3,3′,4,4′,5′-HxCB (157)-4.523
2,3,4,4′,5,5′-HxCB (167)-4.523
2,3,3′,4,4′,5,5′-HpCB (189)-4.523

ダイオキシン類のTFE値のlogをとったものを用意し、各化合物のHSPをYMBを使って計算する。

そしてSphere Calc をReal Dataを使って計算する

結果は上のようなグラフになる。

距離が0になるHSPの値は、[20.62, 3.89, 0]だ。

つまりダイオキシンの毒性は6-7割がたは溶解性だけで決まっていることになる。
同じ溶解性なのに毒性が違うもの(Wikiの説明ではオルト位に塩素を持つPCBはコプラナーPCBと呼ばれ毒性が非常に高くなる)は他の識別子を考え無くてはならないのだろう。

実はこのHSPの距離の計算には、3,3′,4,4′,5-PeCB (126)と3,3′,4,4′,5,5′-HxCB (169)は使っていない。
これを入れると精度が下がってしまう。

3,3′,4,4′-TCB (77)0.0001
3,4,4′,5-TCB (81)0.0003
3,3′,4,4′,5-PeCB (126)0.1
3,3′,4,4′,5,5′-HxCB (169)0.03

コプラナーPCBは毒性が高くなる言うが、毒性の高くなるのは下の2つだけで、上の2つは毒性が高くない。

溶解性だけでもダメで、残りの因子を考えることが重要になる。

最初の文献では、溶解性の指標に、logP(オクタノール/水分配比率)を使っているが、

これからは、判らないだろう。

QSARとは、単相関が無いものを組み合わせて、一見相関がありそううな複合式を作る技術だが、識別子としては少しでも高い相関があるものを選ぶに越した事は無い。

それは、AIの学習でも同じだろう。

解析例トップ
 医薬品・化粧品トップページ
 環境、溶媒設計トップページ


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください)
メールの件名は[pirika]で始めてください

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です