pirika logo

ホームページ Pirikaで化学 ブログ 業務案内 お問い合わせ
Pirikaで化学トップ 情報化学+教育 HSP 化学全般
情報化学+教育トップ 情報化学 MAGICIAN MOOC プログラミング
MAGICIANとは、材料ゲノム(Materials Genome)、材料情報学(Materials Informatics)、情報化学(Chemo-Informatics)とネットワーク(Networks)を結びつけて(Associate)いかれる人材です。

情報化学+教育 > 情報化学 > SOM

2021.6.3改訂(2002年頃の記事)

動物の分類

Readボタンを押してデータを読み込み、Startしてください。何か模様が出てきたら成功です。動きが止まったらStopボタンを押してください。(SOMのバージョンによって以下の画面は異なります)

参考文献:自己組織化マップの応用、多次元情報の2次元可視化 徳高平蔵、岸田悟、藤村喜九朗 著 KAIBUNDO
もしくは、こちらの論文を参照してください。

ここで読み込ませたテーブルは次のようなテーブルです。

1行目、1列目はタイトルなど自由なものを入れます。
2列目はラベルを入れる部分です。
このラベルは数値でも文字でも良いのですが、大事な点はSOMを描くには使わない点です。
2列目以降は数値データになっています。そして、その動物を表す15種類の数値が入っています。
この15種類の数値のことを、15次元のベクトルと言う言い方をします。
そして、スタートボタンを押すと、このベクトルを似たベクトルを2次元上の似た位置に配置します。
初期値には乱数を使うので、startするたびに結果は異なりますが、配置される相対関係は大きくは変わらないはずです。

16種類の動物が上手に分類されている事が判ると思います。

その分類のされ方に注目してみて下さい。
例えば虎とライオンと狼は近いところにいるはずです。
犬と狐と猫や牛と馬も近くなっていませんか? 
あひると鴨というように近いところには似た動物が配置されているのが判ると思います。

これが自己組織化です。やる度に配置は異なりますが全体の近いものは近い位置と言う関係は同じだと思います。

こうしてできたマップに対して例えば鶴はどこにくるかを検討するのが自己組織化マップ(SOM)を用いた解析になります。

体が大きく二本足で羽を持っていて飛ぶ。
ですから鳩と馬、シマウマの中間ぐらいで鳩に近い位置にくるのでしょうか?

さて、動物を表す15次元ベクトルを似たものを似た位置にマッピングできるのであれば、他のベクトルでも同じようなことができます。
例えばベクトルをネットで購入した書籍A-Oだとします。購入した場合には1, レンタルしたら0.5だとかテーブルがあったとします。
そうすると、これまでに購入した書籍の傾向が似ている人は似ている位置にマッピングされるはずです。

すると、J:オオカミさんと似たような購買履歴を持っているのは、I:犬さん、K:猫さん、L:トラさん、M:ライオンさんです。
それなら、狼さんには、「他の方は本A、本C、本Kも買っています」とお薦めするのが合理的と言えます。
似たような購買傾向を持っている購買者のクラスターから、その人がまだ持っていない物が割り出されます。

もっとも、子供が買いたがった趣味のものの購買記録から、子供が家を出ても未だにおすすめする辺りは改善の余地があるでしょうが。。。

有名な、あやめの分類をSOMで

最近、そうした分類は、階層的クラスタリングで行うのが流行っています。
次のようなデンドログラムを見たことがあるかもしれません。

この元のテーブルは、次のような4次元データです。

このデータをデンドログラムで見て、おーーなるほどと思える人は脳が随分とAI化した人なのでしょう。
私はSOMで見る方が好きです。

データをReadしてStartボタンを押してください。

乱数次第で少し異なるかもしれませんが、次のような図が得られて、S, VE, RGが2次元上で分離されていれば成功です。

情報化学+教育 > 情報化学 > SOM > 動物の分類


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。