製品品質に影響がある変数の選び方【後編】

京都大学 教授 加納 学

前回は、予測誤差に基づく変数重要度を紹介しました。その長所は、プロセス変数から製品品質を予測するモデルは何でもよい
(予測誤差が計算できればよい)、考え方が単純で理解しやすい(ある変数を用いて予測誤差が小さくなれば影響があると
みなす)、従来から使われている方法に性能面で見劣りしない、といったところです。控え目に「見劣りしない」
と書きましたが、経験上、かなり正確に変数重要度を算出してくれます。

しかし、長所ばかりの方法がないのが世の常です。

stockfoto_18875489_XS.jpg

予測誤差に基づく変数重要度にも短所があります。それは、影響度を
把握したい変数の数だけモデルを構築する必要があることです。変数Aの重要度を計算するためには、変数Aを用いるときと
用いないときの2つのモデルを構築して、予測誤差を比較しなければなりません。気になるプロセス変数が100変数あれば、
101個のモデル(100個のモデルとすべての変数を用いたモデル)を構築しなければなりません。
このため、特に複雑なモデル構築方法を採用する場合、解析結果を得るために多くの時間が必要になります。

そこで、構築するモデルが1個だけでよい方法も自分の道具箱に入れておくことにしましょう。もちろん、プロセス変数から
製品品質を予測するモデルは何でもよい、考え方が単純で理解しやすい、従来から使われている方法に性能面で見劣りしない、
といった長所はそのまま引き継ぎます。そんなに都合の良い方法があるのかと怪しまれるかもしれませんが、あります。
それは、非線形回帰モデルの感度を用いて変数重要度を計算する方法です。

感度とは接線の傾きだと考えればいいでしょう。例えば、製品品質201809_5.pngとプロセス変数201809_4.pngの関係が

201809_1.png

でモデル化できるなら、201809_2.png201809_5.pngの傾き(微分係数)201809_3.pngが感度であり、この値が大きければ大きいほど、

プロセス変数201809_4.pngを変化させたときに製品品質201809_5.pngが大きく変化することになります。ただし、モデルが非線形であれば、
感度は201809_4.pngの値に依存して変化するため、何かうまい定義を与える必要があります。

非線形回帰モデルの感度を用いた変数重要度

計算方法を具体的に見ていきましょう。まず、プロセス変数から製品品質を予測するモデルを用意します。
どのようなモデル構築方法を用いても構いません。研究室でよく用いているのはガウス過程回帰ですが、
サポートベクトル回帰など何でも構いません。得意技を繰り出して下さい。なお、構築するのが線形回帰モデルであれば、
その回帰係数を評価すればよいだけですので、ここでは非線形回帰モデルを使います。

なんらかの方法で構築したモデルを

201809_1.png

としましょう。201809_5.pngは目的変数(製品品質)、201809_4.pngは説明変数(プロセス変数)を並べたベクトルとします。

この関数201809_6.pngの第i変数201809_7.pngに対する感度201809_8.pngを次式で定義します。

201809_14.png

ここで、201809_10.pngは確率密度関数です。微分係数(傾き)を二乗しているのは、正の微分係数と負の微分係数が互いに
打ち消し合わないようにするためです。一般に、201809_10.png201809_8.pngを求めることは難しいので、代わりに、次式の

経験的な推定量を用いることにします。

 201809_11.png

ここで、201809_13.pngn番目のサンプルであり、サンプルは全部でN個あるとしています。このように標本平均を

用いることで、実際の操業条件を反映した感度を求めることができます。つまり、実際に頻繁に使用している
運転条件を重視して感度を求めることにより、現場感覚にあう結果を得ることができます。

この感度の平方根を変数重要度とします。なお、感度を計算する前に説明変数を標準化しておきます。
偏微分の求め方が気になるという方には、もう少し説明が必要ですね。例えば、ガウス過程回帰をモデル構築に用いる場合、
目的変数201809_5.pngの平均値がカーネル関数と201809_5.pngの実測データを用いて数式で表現されます。
これがモデル201809_6.pngそのものであるため、解析的に偏微分を求めることができます。

微分係数は傾きであり、(標準化された)プロセス変数を単位量だけ変化させたときに製品品質がどれだけ変化するかを
意味します。このため、感度を用いた変数重要度はその物理的意味がとてもわかりやすいという特長があります。ただし、
入出力関係が非線形である以上、感度は操業条件に依存して変化することに注意して、結果を活用しなければなりません。

感度を用いた変数重要度の応用例

感度を用いた変数重要度の適用事例を紹介します。

stockfoto_35403745_XS.jpg

製鉄所では、製品である鋼板の内部に発生する欠陥が大きな問題と
なっていますが、転炉、連続鋳造、二次精錬、圧延など多くの複雑な工程を経て鋼板が製造されているため、内部欠陥の
発生要因を突き止めるのは容易ではありません。そこで、非線形回帰モデルの感度に基づく変数重要度を用いて要因解析を
実施しました。技術者がその知見と経験に基づいて計71変数のうち21変数を重要であると判定した結果が正しいと仮定して、
従来法と提案法の正答率を比較しました。正答率とは、重要と判定された21変数が各手法による変数重要度の上位21変数に
含まれる割合です。その結果、線形回帰手法であるPartial Least Squares (PLS)の回帰係数を用いる方法や、非線形回帰手法
であるRandom Forest (RF)の変数重要度を用いる方法に比べて、ガウス過程回帰モデルの感度に基づく方法が最も高性能
であることが確認できました。つまり、技術者の感覚に合致する結果が得られたことになります。ただし、真の変数重要度は
わからないため、この結果だけをもって、手法の優劣を結論づけることはできません。
今後、重要度の高い変数を実際に調整して、内部欠陥が減るかどうかを確認する必要があります。この検討結果については、2018年9月に開催される化学工学会秋季大会および2018年12月に開催されるIEEE Conference on Decision and Control (CDC)にて発表する予定です。

予測誤差に基づく変数重要度と同様、非線形回帰モデルの感度に基づく変数重要度についても、現在、様々な
実プラントデータへの適用を進めているところです。このような解析に煩わされなくてすむ日が来ることを願いつつ。

  • LINE
  • Mail