クロマトグラフィーのピークを分離するプログラムが出てきた。
そこで、週ごとのコロナの感染者数をピーク分離させてみた。
この調子で行くと、9月の第X週には感染者数はXX万人になるとAIが予測しているとか報道されている。まー、AIというのは嘘だろう。単に統計で見るとそうなるかもしれない。AIというのは、中身がブラックボックスで説明責任から逃れたいが見え隠れして嫌いだ。
そうした、統計法とはちょっと毛色の違うやり方で分析してみた結果を示そう。
私ぐらいの歳の化学系の研究者は、液体クロマトグラフィーやGPCの測定を行った後、チャートをコピーして、ハサミで切り抜いて重さを測ってピークの定量を行ったこともあるかもしれない。
ピークが分離していればそれも簡単だが、ピークが一部重なってしまった時に、どう切り分けるか(欲しいものの収率が少しでも多くならないかなー)と悩んだものだった。
そこで、コンピュータに任せて私情が入らないようにってプログラムを組むことになる。
その後しばらくすると、インテグレータなるものが開発されて、自動的に定量されてしまうので、ピーク分離する必要すらなくなって、この技術は完全に闇の中に消え去った。
そんなプログラムが出てきて未だに動くのは奇跡かもしれない。
暇にまかせてコロナの波を分離してみた。
実線は2022年になってからの感染者数を1週間分まとめたものをプロットしたものだ。
これを見た時には、ピークは5つぐらいあるのかな?と思った。そこで7つピークがあるとして分離させると2つのピークは自動的にゼロになり、5つのピークが生き残った。
いわゆる第6波は緑色のピークで示されるように、第6週ぐらいにピークの頂点があった。
そして、オレンジのブロードな幅広いピークが第14週くらいにピークの頂点を持っていた。なだらかに減少していくのはこの緑とオレンジの線が混じっているからと解釈するとプログラムは言っている。
問題は、いわゆる第7波だ。
3つのピークが重なっているとプログラムは判断している。
青いピークは23週くらいから徐々に増え始めて、8/20の33週でピークになりかけている。
赤いピークは26週から増え始めて30週からは減り始めている。
気になるのが、紫のピークだ。
31週くらいから増え始めている。
このピークがどうなるか次第で、いわゆる第7波にかぶさって第8波が増えていくのかもしれない。
学習した範囲外まで、どのくらい外挿性があるか楽しみだな。
こうしたピーク分離は、Ba5だケンタウロスだとかそうした情報は使っていない。
興味のある人は検討してみると面白いと思う。
判断材料が誰もが共通に持っている統計だけだと、誰がやっても同じ答えしか出せない。ピーク分離で将来を予測した例は(当たり前だろうけど)見たことがない。
自分の化学者としての考え方を、どうしたらニューラルネットワーク(NN)に載せることができるか?
そんな風にして作った20年前のプログラムが、なるほどなー。やっぱそう考えるよなー。というピーク分離のパターンを返してくれる。
統計的に説明しろって言われても困るけど、良い味出していると、ちょっと嬉しい。
クロマトチャートを切り抜いた経験のある人しかわかってくれないかもしれないが。。
そっか。独立成分分析なら分離できるかもしれないな。そのプログラムは難しくて諦めてしまったけど。