非線形解析ツールMIRAI

情報化学+教育 > 情報化学 > 解析ツール、MIRAI

MIRAI(Multiple Index Regression for AI)はデータ数が少ない、識別子が多い、非線形性があるケースに使う解析ツールです。

普通のMI(Materials Informatics)を仕事に活かせない業界は非常に多いようです。
ここでは、特許に記載されている一例を紹介します。

2列目は官能評価(とても良いと感じる=5、とても悪いと感じる=1)結果です。
その後の列は、配合成分です。それぞれの成分は市販品として販売されており、正確な内容はわかりません。
カーボンブラックのようなものを想像してください。CB(A-1)はW社から、A-2はX社から、A-3はY社から購入しています、などです。

分かっているのは、それぞれの成分をどれだけ使って配合したか、官能評価値がいくつ得られたかだけです。

さらに、官能評価には複数の種類があります。

私たちがやりたいのは、MIを使って、複数の官能評価値の予測値が得られ、すべての評価値が5点になるような処方を設計することです。

しかし、この場合、RDKitの識別子も分子軌道計算の結果も使えません。
また、官能評価には何人もの人のデータを集めるため、データを増やすことも容易ではありません。

この問題に対して、MIの研究者はどうすればいいのでしょうか?
腕に自信のある人は、次のデータで予測式を作り、予測処方の値を予測してみてください。
テキストエリアにあるデータをコピーしてエクセルなどにペーストしておいてください。

Pirikaには新しい分析ツール、MIRAI(Multiple Index Regression for AI)があります。
今回、このツールをWebアプリ化しました。
MIRAI-Run

エクセルのテーブルをソフトにペーストして、グループ分けもペーストして、ソフトを走らせます。

計算にはとても長い時間がかかります。手順を学ぶ為、計算結果を模擬的に返すWebアプリのCalcボタンを押し、計算結果の=以降をコピーしてエクセルに戻します。

MIRAI

Input Data


Group



Result


MIRAI-Run

計算結果を適当な列の2行目にペーストしてグラフを描いてみましょう。次のようなグラフが得られれば成功です。

MIRAI-Run

通常の重回帰解析では、次のようになります。

MIRAI-Run

重回帰法の欠点として、説明変数間に相互作用があるもの、非線形なものには使えないことが挙げられます。

それに対して、MIRAIはフィードフォワード型のニューラル・ネットワーク法で、データ数がこのように少なくても、予測性能を維持できるように設計されています。



MIRAI-Run

計算結果=
C0 + Σ[(Ca*Xa+Cb*Xb・・Ci*Xi+1)^α
  *(Cm*Xm+・・・ +Cq*Xq+1)^γ 
  *(・・・    +Cz*Xz+1)^ω ]

今回の解析では、パワー関数の掛け算でベータの値を再現する式を構築し、学習に含めなかった処方の結果を推算しています。

4種類の推算式を構築してしまえば、後はコンピュータ上で片っ端に評価がオール5になる処方を探させれば良いのです。

このMIRAIの機能は、GROVEに統合する予定です。

塗料、インク、化粧品の特許への応用例をこちらにまとめました

Copyright pirika.com since 1999- 
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です