Pirika logo
JAVA,HTML5と化学のサイト

Pirika トップ・ページ

Pirikaで化学
 物性化学
 高分子化学
 化学工学
 分子軌道
 情報化学

 その他の化学
 アカデミア
 MOOC講義資料
 プログラミング

ハンセン溶解度パラメータ(HSP):
 HSP基礎
 HSP応用
 ポリマー
 バイオ・化粧品
 環境
 物性推算
 分析
 化粧品の処方設計
 その他
 自分でやってみよう

雑記帳

代理購入?
英語で諦めていませんか?HSPiPの代理購入なら映像工房クエスチョンへ。すぐにお見積りします。
(日本語ドキュメントサービス中)。Mail

 

Ad Space for you

 

 

 

Last Update

25-May-2017

MOOC: 002-重回帰法の基礎

講義資料 非常勤講師:山本博志  2014.7.17

重回帰法の基礎:

会社に入ったら絶対に役に立つのが、重回帰計算法だ。Excelにも搭載されているので使い方は完全にマスターしておこう。

例えば、八百屋で果物の詰め合わせが売っています。

ケース 値段 みかん りんご ばなな
1 300 2 2 0
2 180 3 0 1
3 360 4 1 2
4 180 1 1 1
5 350 3 2 0
6 460 4 2 2
7 520 2 3 4
8 440 3 2 3

みかん、りんご、バナナの値段はいくらでしょう?

という問題があったとする。これは連立方程式の問題で、中学生ぐらいで習う。暗算でも簡単に解けるだろう。YSBを使ってデータを入れれば簡単に結果が得られる。

値段=50*みかん個数+100*りんご個数+30*バナナ本数

一般にある目的変数が1つあって、説明変数が複数あって上のような式を得る事を重回帰計算という。各説明変数の前にある50, 100, 30を重回帰係数と呼び、式自体を重回帰式と呼ぶ。

こうした重回帰式は化学の分野でもよく使われ、例えば沸点の推算のJoback法では原子団の数とその寄与度から次式で沸点を推算する。

Tb=198.2+sigma(ni * deltabi)

Tb: 標準沸点,[K]
ni: i番目の部分構造の数
deltabi: JOBACKのi番目の部分構造の沸点に対する寄与度, [K]

様々な原子団寄与法を使った推算式が提案されている。そうした推算式を構築したければ、物性値と原子団が幾つあるかのテーブルを作成し、表計算ソフトに搭載されている重回帰計算を行えば推算式が構築できる。

しかし、算数ならともかく、化学の現象はそこまでシンプルでは無い。例えば温度が上がると急に反応速度が早くなったり(非線形性)、ある圧力とpHで急に様子が変わったり(相互作用)一筋縄ではいかない事が多い。

難しい例として水への溶解度の推算を例を解説しているので一読する事をお勧めする。

そうした場合にはQSPR(定量的構造物性相関)の手法としてニューラルネットワーク法などを用いて解析を行う。しかし、これはこれで過学習などの問題があり使い方が難しい。

2014年の講義からYSBというソフトウエアーを提供している。このソフトウエアーで加味するクロスタームについて説明する。

例えば、先ほどの例で果物の値段を決める時に、バナナとリンゴは大量入荷したので、バナナとリンゴを両方購入した場合には、-X円*バナナ本数*リンゴ個数、割引するとしよう。

テーブルはこのようになる。

ケース 値段 みかん りんご ばなな
1 300 2 2 0
2 180 3 0 1
3 340 4 1 2
4 170 1 1 1
5 350 3 2 0
6 420 4 2 2
7 400 2 3 4
8 380 3 2 3

普通に重回帰計算を行うと、

値段=54.8367*みかん個数+85.1317*リンゴ個数+6.059*バナナ本数+18.5142

となる。この重回帰式は明らかにおかしい。何も買わなくても18.5円になってしまう。

しかし、統計的には相関係数は非常に高く、正しく推算でいているように思えてしまう。

この場合は実はX=10円としてある。こうしたXを求める事は表計算ソフトに付属の重回帰計算ではできない。しかし、化学の分野では、沸点の推算で、COOHが沸点を上げる効果、NH2が沸点を上げる効果の各々の重回帰係数が求まっていても、COOH,NH2を両方持つ化合物の沸点が各々の重回帰係数の和だけで決まらない事は明らかであろう。+X*COOH個数*NH2個数の補正値を入れないと答えは合わない。

こうした説明変数間の相互作用を考慮し、クロスタームを自動的に挿入するのがYSBというソフトウエアーだ。

果物の例では、クロスタームは、みかん*りんご、リンゴ*バナナ、みかん*バナナの3種類ある。その3種類を評価して、

値段=50*みかん+100*リンゴ+30*バナナ+-10*リンゴ*バナナ+0

という重回帰式を構築してくれる。

そして、その時の相関係数Rの自乗(決定係数)は1になる事が示されている。この場合はシンプルだが、実際の問題への応用は、クロスタームの数と決定係数の値を見ながら最適なクロスターム数を人間が決定する必要がある。

線形式、非線形式をどのように使いこなすかに関しては、ハロメタンのケミカルシフトの記事を参照にする事。YMBが対応していない項目を使って推算式を構築するには、E-Inkの設計を参照。

 

フッ素ゴムの耐溶剤性の例、2011年(本文はこちらを参照

例えばあるポリマーの溶媒に対する体積膨張率が
体積膨張率=a*溶媒の密度+b*溶媒のダイポールモーメント+c*溶媒の負電荷最小値+d
と表す事ができるとしよう。様々な溶媒で試験した体積膨張率と溶媒の物性値があれば、

129=0.795*a+0.997*b+-0.343*c+d (アセトン)
135=0.803*a+1.842*b+-0.212*c+d (MEK)
164=0.803*a+1.66*b+-0.331*c+d (MIBK)
77=0.985*a+0.195*b+-0.266*c+d (エチルカーボネート)
100=0.9*a+1.375*b+-0.297*c+d (酢酸エチル)
89=0.92*a+0.928*b+-0.289*c+d (アクリル酸メチル)
31=0.734*a+0.347*b+-0.216*c+d (ジエチルエーテル)
140=0.872*a+1.67*b+-0.21*c+d (THF)
35=0.733*a+0.015*b+-0.036*c+d (トリエチルアミン)
85=0.935*a+1.603*b+-0.334*c+d (DMF)
5=1.636*a+0.009*b+-0.2*c+d (四塩化炭素)
14=1.577*a+0.857*b+-0.154*c+d (クロロホルム)
15=1.403*a+1.074*b+-0.058*c+d (ジクロロメタン)

次のような連立方程式を作る事ができる。これを行列で表現すると以下のようになる。

a-dが求まり、任意の溶媒の密度、ダイポールモーメント、負電荷最小値がYMBで計算できれば、その溶媒がどれだけポリマーを膨潤させるかは簡単に計算できる。

 

自分でやってみよう(MOOC)トップページへ戻る。

 

メールの書き方講座