スモールデータエンジニアが呟きます

2017.04.21

京都大学 教授 加納 学

 製造業の現場では、データ解析の結果をなかなか受け入れてもらえないことが多くないでしょうか。もちろん、製品特性を推定するにしても、異常を検出するにしても、操業条件を最適化するにしても、データから導き出した結果が常に絶対に正しいとは言えません。

stockfoto_32514135_XS.jpg

それでも、もう少し耳を傾けてくれてもいいのにと思ったことのある人は手を挙げて下さい。
はい。
ありがとうございます。かなり多いですね。
 ところが、いまやビッグデータの時代です。
(とは言っても、ガートナーのハイプサイクル2014年版で既にピーク期から幻滅期へ移っていたのですが...)「我が社もビッグデータを活用していく(丸投げ)」といった天の声を聞いた人もいるでしょう。Industry 4.0やIoTが注目され、製造業でもこれまで以上にデータを活用しようという気運が高まっています。それは良いことなのですが、ビッグデータに想いを馳せる前に、既に社内にあるデータに目を向けて,その活用を図ることも考えるべきではないでしょうか。そのデータがスモールデータだからというのは、活用しない理由にはなりません。むしろ、だからこそ大きな投資をしなくても成果を出せる可能性があるわけです。

 スモールデータエンジニアを自任する筆者は、大学で化学工学を専攻したこともあり、これまで主に製造業のプロセスデータ解析に取り組んできました。様々な企業と共同研究をする中で、データ解析担当の方々が社内でなかなか認められずに苦労される様子を何度も見てきました。その経験から学んだのは、

1)現場に足を運び,現場をよく知るべき。(特に自分への戒め)

2)課題解決に用いるデータ解析手法は理解しやすい単純なものにすべき。

3)最初は小さな課題で確実に成果を出すべき。

stockfoto_66307695_XS.jpg

ということです。自分がデータ解析をする上で、プロセス(製造設備)のことがわかるのは大きな強みだと感じてきました.データと専門知識を統合して活用することで成果をあげやすくなります。現象論に基づく物理モデルとデータに基づく統計モデルを組み合わせるグイボックスモデルの利用も。そのような方策の一つです。そういった想いから、スモールデータエンジニアと名乗っています。

 ビッグデータが流行ったからスモールデータなんて言葉を使っているのだろう,軽薄だな、と感じられた方もいるかもしれません。しかし、スモールデータ自身が大変注目されてきたという事実があります。Paul Greenbergは記事"10 Reasons 2014 will be the Year of Small Data "(ZDNet, 2014)で、次のような定義を紹介しています。

スモールデータは、ビッグデータおよび/あるいは「局所的な」情報源から導出された)タイムリーかつ有意義な洞察を,アクセス可能かつ理解可能、日々の業務でアクション可能なかたちに(そしてしばしばビジュアルなかたちに)体系化してまとめ上げたうえで、人と結びつけるものである。(日本語訳はZDnet Japan から引用)

 スモールデータの活用については様々な議論がなされてきましたが、例えば、David Meerは記事"When Big Data Isn't an Option"(strategy+business, 2014)の中で、企業がスモールデータ(原文ではLittle Data)を活用するために必要なこととして次の3つを挙げています。

1)事実に基づいた意思決定(これが競争優位に繋がる)

2)実行から学ぶ意志(試行錯誤が有益な経験や成功に繋がる)

3)少しの創造性(より良いデータの取得や解釈に繋がる)

stockfoto_35351231_XS.jpg

 製造業はスモールデータの宝庫です。長年そのデータを埋もれたまましてきた企業は少なくないはずですが、今こそスモールデータを活用するときです。現場には(属人的であったとしても)貴重な専門知識が蓄えられています。その知識とデータを繋ぎ合わせ、飛躍的に能力の向上した計算機や解析アルゴリズムを用いて、成果を出すときです。ハードディスクをデータの墓場にしておく時代ではありません。