Pirika logo
JAVA,HTML5と化学のサイト

Pirika トップ・ページ

Pirikaで化学
 物性化学
 高分子化学
 化学工学
 分子軌道
 情報化学

 その他の化学
 アカデミア
 MOOC講義資料
 プログラミング

ハンセン溶解度パラメータ(HSP):
 HSP基礎
 HSP応用
 ポリマー
 バイオ・化粧品
 環境
 物性推算
 分析
 化粧品の処方設計
 その他
 自分でやってみよう

雑記帳

Ad Space for you

 

Ad Space for you

 

 

 

Last Update

15-Nov-2018

情報化学:知識の獲得 ニューラルネットワークの基本

非常勤講師:山本博志 講義補助資料(2003年頃)

 

自分は日本化学会の情報化学部会に所属しているけど最近は討論会も参加していません。一時期からポスターなどが派手になってポスター賞とかをとっているのだけど中身は去年の発表と何が違うのだよっていうような発表ばかりが目につき、わざわざ聞きに行く必要性を感じなくなってしまいました。部会誌も経費削減の為ネット上で閲覧ということになってから一度もながめていません。ケモ・インフォマティクスなんて偉そうな事言ってもオールド・ケミストはやはり紙の媒体が好きです。


 だけど学会に参加しなくなった本当の理由は家庭の事情って奴です。双子の子供を見てる方がよっぽどインスパイアーされます。情報の分野の中でもニューラル・ネットワークを多用する自分はニューラルネットワークが知識を獲得する過程がもっとも興味を引きます。双子のチビズはちょうどネットワークが繋がりはじめた頃。日に日に言語を獲得し、悪知恵を働かせる頃で学会発表を聞いているよりよっぽど研究に役立つと思います。

ニューラル・ネットワークは学習によって知識を獲得します。
うちの双子のちびずにこれは「わんわん」、これは「にゃーにゃ」って教えるのと同じです。
子供に「ひげの長いのがにゃーにゃ」とか「顔がとがっているのがわんわん」って教える事はないでしょう? 大人でも犬と猫の違いを論理的に説明しろって言われると困ります。
それでも現物で教えられれば泣き声で教えられるでしょうけど絵本ではそれも無理です。でもチビズは何度も絵本を指差し、これは「わんわん」、これは「にゃーにゃ」と教えていると、どこをどう特徴抽出したのかは分からないけどだんだん正しい認知をするようになります。

 一方、コンピュータというものはプログラムで動作します。プログラムと言うのは「ここがこうだったら、ああしろ」「そこがそうだったら、こう思え」っていうように厳密な定義のもとに動作させるのが一般的です。ですからコンピュータに猫の写真と犬の写真を見せてどちらがどっちかを当てさせるのは非常に難しい事です。(このページを書いた2003年頃には。今(2018年)はディープ・ラーニングで容易になった。)これが手続き型コンピュータ処理の特徴です。
コンピュータによる知識の獲得(JAVAによるデモ)
JavaScript バージョン

簡単な図形を書いてそれが何であるか教えて下さい。学習が進むにつれてそれが何であるか分かってきます。

1943年にMcCullochとPittsによってニューロンの動作のモデルが提案されています。これは世界最初のデジタル電子計算機ENIACが完成したのが1946年ですからそれよりも3年も前にモデルはできていた事になります。プログラム(マシン語)内臓のコンピュータ、EDSACが製作されたのが1949年ですから、その時に手続き型コンピュータ言語のマシン語や後のFortran(1957年)ではなくニューロンや後のパーセプトロン(1962年)が採用されていたらコンピュータは全く違った発展をしたのではないかと思います。

こんなの化学と関係ないじゃないか!って怒る人もいるかも知れませんね。でもこの基本がマスターできれば例えば赤外スペクトルでエステルは何cm-1にでる。隣が芳香環の時はどうずれる、ハロゲンの時にはどうなるなどを学習して行けばどんどん賢いコンピュータになっていきます。ぜひ原著を当たって考え方の基本を修得して下さい。

次の例は人生ゲーム、ハイ&ローみたいな知識の獲得です。

私が一番多用しているのは定量的構造物性相関(QSPR)をやるためのニューラルネットワークです。これは例えば分子の構造と沸点の関係とか分子の構造と密度の関係とかを解き明かします。コンピュータは実はこうした「大きい、小さい」「長い、短い」「重い、軽い」とかの認識は不得意です。それはコンピュータが体を持たないからだという説もあるくらいで、ロボット工学が進めば(コンピュータが身体を獲得すれば)こうした認識に関しても新しい理論が展開されるかもしれません。うちのチビズはそんな新しい理論などなくても「いっぱい、大きい」などの量に関する認識を確立していきます。なぜそれが確立されたか分かるかと言うと次の写真を見ていただきたいのですが、チビズはトウモロコシが大好きです。トウモロコシを二つに折ってチビズにあげると

だんだん悪賢くなるもので、自分のが小さいと思うと、まず、自分のどうぞってあげてしまいます。もらった方は大好きなトウモロコシが2本になったので大喜びです。どちらから食べようかと思案しているとすーっと大きい方のトウモロコシに手を伸ばそうとするやつがいます(左の子)。当然この後取り合いの喧嘩になったのですが、母親は当然手に2本トウモロコシを持った子がもう一方から奪ったので喧嘩になったと判断して右の子のトウモロコシ(大きい方)を左の子にあげます。一部始終を見ていた父親はなんて悪賢いのだと唖然としてしまいます。コンピュータがこうした戦略までたてて大きいものを手に入れるなんていうアルゴリズムを獲得するまであとどのくらいかかるのでしょう? やはり人間にはかなわないかもしれません。こいつらが大きくなってガールフレンドの取り合いなどはじめた日にはどんな戦略が飛び交う事か?

コンピュータによる大きい、小さいのデモ
n-アルカン化合物の沸点をCH3の数とCH2の数から学習していくデモです。学習が進むにつれてニューラルネットワークにどのような知識が貯えられて行くのかが理解頂けると思います。

このニューラルネットワーク法にも重大な欠点があります。ニューラルネットワーク法を用いて機械学習する際に良くであう問題、 過学習と予測性の欠如をお読みください。

こうした色々なニューラルネットワークを駆使して色々なことに応用しています。

情報化学のトップへ戻る