pirika logo

Home 化学 HSP 情報化学+教育 PirikaClub Misc.
情報化学+教育トップ 情報化学 MOOC YMB MAGICIAN MAGICIAN Club
MAGICIANトップ 過去の資料 例題 Misc.

MAGICIAN養成講座

2020.4.18

講義資料 非常勤講師:山本博志

MAGICIAN(MAterials Genome/Informatics and Chemo-Informatics Associate Networks)

最近の「コンピュータによる材料開発」

特に大きな違いは無いので、全部をまとめてMAGICIANと呼ぶ事にしています。

過去の資料 

概要 私が量子化学計算を始めたのは、30年前のことです。 最初は、重合など反応を扱う事が多かったので遷移状態の計算ばかりやっていました。

だんだん「自分のやりたいことは逆設計」ということで情報化学にシフトしていきました。
「物性推算と逆設計」と呼んでいた時に外部で発表していたものを置いておきます。

企業研究者だったので、外部発表は多くはありません。

例題

概要 ネットで公開されているデータを基に、Materials Informaticsとは、どのように「材料を料理」するのかが概観できるように構成してみました。
一連の要素技術を学べば、後は自分でやれるようになると思います。

最近の深層学習(Deep Learning)の本を読んでいて思い出した事があります。

40年近く前に、NECのPC-8801を購入した。コンピュータのプログラミングに夢中だった頃、確かCP/M-80用(もしくはMS-DOS?)のLISP言語のフロッピーをもらい、PCで動かしていました。

LISP言語というのは当時、人工知能用のソフトという事で、N88-BASICから卒業しようとしていた私が候補の1つとして考えていた言語です。

コンセプトを下図に示しておきます。

Animal

当時のコンピュータはキャラクター・ベースで動作します。

まず最初にコンピューターが「何か動物を思い浮かべてください」といいます。

人間はYes, Noしか答えられません。
(数十種の質問が入っていたと思いますが、そんなものは覚えていないので、ツリーは適当に作りました。)

コンピュータの質問に対してYes,Noを答えていく。
「陸上生物ですか?」Yesを選ぶ。
「羽を持っていますか」Yesを選ぶ。
「飛びますか?」Noを選ぶ
すると、コンピュータが「思い浮かべたのは、ダチョウですか?」と聞いてくる。
答えが、Yesならコンピュータの勝ち。
答えが、No(例えばペンギン)なら「ダチョウとペンギンを識別する質問を教えてください」とコンピュータが言う。
ゲームを続ければ続けるほど人工知能は賢くなると言う例題でした。

両生類や雑食性を入れたければ、ツリーを細かくとります。
(陸上生物のところで、「水中でも生活しますか?」とか)

現在のDeep Learningはこれを、写真だけから、自問自答して学んでいっているだけ?
と言うのが本を読んだ感想でした。


すると、くじらの写真を見せた時に、写真から「肺を持っているかどうか?」はどう判断させればいいのでしょうか?
「エラを持っている」かどうかは解剖写真を見せなければ解りません。
殻を脱皮したソフトシェル・クラブは? 
引っ越し中のヤドカリは? 

まー、写真だけでは大変な事でしょう。
(GoogleがYoutubeを買収したのは、動画を手に入れる為で、潮吹き、脱皮前後、引っ越しなど前後の脈絡を解析する為では無いかと疑っているのは、私だけでしょうか?)

こうしたやり方は、エキスパート・システムとして一時期流行りましたが、場合分けが複雑になりすぎて、実用的に現在まで使われているものはほとんどないようです。

Animal

それでは化学の領域はどうかと言いますと、写真に相当するものは、分子構造でしょう。
写真なら、裏写ししたり、拡大縮小、彩度を変えたりデータを水増しできますが、分子構造は分子構造で1つしかありません。

しょうがないので、分子軌道やトポロジカル・インデックスを計算して、説明変数の水増しを図ります。
しかし、目的変数自体はスモール・データしかありません。

インスタグラムには35億枚のタグ付けされた写真があるそうですが、化合物の毒性の指標の1つ、LD50など、同じ動物種では数千もないでしょう。

目的変数より説明変数が多い場合には、「主成分分析やPLS法を使う」と情報化学は教えてくれます。
しかし、そもそも分子軌道やトポロジカル・インデックスなどの計算結果が本質的な説明変数を必要十分備えているかは誰にもわかりません。

そこで、Deep Learningの結果は「ブラックボックス」になりますが、なんとなくそれっぽい答えを出すようになります。
それでうまくいく領域もあるでしょう。
所詮、「強い者(AI)が勝つのでは無く、勝った者(AI)が強い」のですから。
 

大きいところは、それなりに大きなデータを持っているでしょうから、悠長な事を言っていれば良いかもしれません。

小さいところは、強いAIを目指すのでは無く、AIアシストを目指す方が合理的ではないでしょうか。

人間に不得意なところ(高速性、正確性、網羅性)はAIに任せ、AIに不得意なところ(概念、解釈、閃き、反省)は人間が行うというモデルです。

AIアシストは、電動アシストの自転車と同じで、人間の漕ぐ力が強ければアシスト力も大きくなります。
AIというのは生まれたての赤ん坊のようなものです。
それに何か化学的な事を教える時に、化学力が高い者と、低い者とでは、育ったAIにも当然差が出ます。
他人が育てた「強いAI」を養子に貰おうなんて甘い事を考えていないで、始めましょう。
やっていることは40年前とあまり変わらず、ずーっと楽にできるようになったのですから。

以降、Miscで徒然に。  


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。