ICTイノベート
  • データ分析をセンサーデータとBIツールで実践

  • データ分析をセンサーデータとBIツールで実践
  • 公開2018/08/30  更新2022/06/23

  • データ分析作業の実践例です。センサーデータ収集ツールで得たデータをBIツール(Power BI Desktop)で分析しました。

記事内容

前々回のコラム記事で、センサーデータを収集するツールをご紹介しました。そして前回のコラム記事では、収集したデータの分析に用いる為に必要となるデータクリーニング(データの整形作業)についてご紹介しました。今回のコラム記事では、収集したデータを使用してデータ分析を行ってみます。なお、今回もデータ操作にはMicrosoft Power BI Desktop[1]を用います。

誰でも動作をイメージし易いと考えて、(風向き回転機能付の)扇風機をデータ収集対象として使用しました。得られたデータを分析することによって、扇風機の動作をどの程度捉えることができるのか試してみましょう。なお、データ収集ツールによってデータ収集を行った際の作業イメージは下図のようになります。

扇風機からのデータ収集作業イメージ図
『扇風機からのデータ収集作業イメージ図』

扇風機の風向き回転部分にマルチセンサー[2]をテープで貼り付けます。このセンサーとBLE[3]で通信を行うRaspberry Pi(ラズベリーパイ)[4]上にCSVファイルとしてセンサーが計測したデータを出力し、これをデータ分析に用います。なお、計測にあたっての扇風機やセンサー設定の情報は次の通りです。

  • 10分間計測を行った
  • センサーの計測間隔は1秒
  • 扇風機の風向き回転は、一周するのに約12秒かかる
  • 計測開始後、最初の30秒は扇風機自体を停止状態とした
  • 次の30秒は扇風機の羽根を回転させたが風向き回転なしとした
  • その後は扇風機の風向き回転を(正面から見て)時計回りに回転させた
  • 後半に扇風機を一旦停止させ、直ぐに反対の回転(反時計回り)で風向き回転を再開した
  • 計測終了前の30秒程度も扇風機自体を停止状態とした
  • 扇風機へのセンサー設置にあたり、設置面が僅かにおわん型だったので、Z軸方向に少なからず傾きが生じていた

今回は動作の計測なので、加速度センサー地磁気センサーのデータに着目します。それぞれ3軸(X, Y, Z)の計測値を得られますので、軸毎に折れ線グラフにします。まずは、計測時間範囲全体のデータからグラフを作成します。なお、以降のグラフでは、横軸が時間、縦軸が計測値になっています(加速度単位は[G]、地磁気単位は[μT])。

加速度と地磁気の全範囲グラフ
『加速度と地磁気の全範囲グラフ』

それぞれのグラフを見ると、計測開始時や終了時に扇風機を動かしたり止めたりした操作が波形に表れていますね。ただ、このグラフだと全体の傾向は捉え易いですが、風向き回転中の動作をより詳しく分析したいので一部を抜き出してみることにします。波形が余り不規則に変化していない時間帯の1分間を抽出してみます。まずは時計回り時のグラフを作成します。

加速度と地磁気の1分間抽出グラフ(時計回り)
『加速度と地磁気の1分間抽出グラフ(時計回り)』

加速度グラフを見ても、地磁気グラフを見ても、周期運動をしていることがグラフに表れています。また波形の山と谷の数から、1分間に約5回転していたことが読み取れます。風向き回転は一周に約12秒掛かっていたので一致しますね。次に風向き回転が反時計回りの時間帯から1分間を抽出してグラフを作成します。

加速度と地磁気の1分間抽出グラフ(反時計回り)
『加速度と地磁気の1分間抽出グラフ(反時計回り)』

時計回りのグラフと比べて、X軸グラフ(青)とY軸グラフ(ピンク)の関係性が入れ替わっていますね。これは回転方向が替わることによって、X軸とY軸の符号(方向)の関係性が変化することがグラフにも表れています。次は加速度グラフと地磁気グラフをそれぞれ見て行きましょう(1分間抽出グラフ)。

まず加速度グラフです。周期的な波形を示していますが、風向き回転はほぼ等速運動でしたので加速度は0(ゼロ)になるのではないか?と疑問に感じた方もおられるでしょう。確かに運動加速度の面ではゼロになるはずですが、センサーは重力加速度も計測している為に計測値はゼロにはなりません。

この点については加速度の全範囲グラフを見てみましょう。計測開始早々は扇風機は停止状態でしたが、加速度の計測値はY軸(ピンク)がほぼ-1になっています。これはY軸方向に重力加速度を計測していることを示しています。

加速度センサーの種類によっては重力加速度を計測しないタイプも有りますが、今回用いたのは重力加速度が計測されるタイプの加速度センサーということになります。なお、重力加速度を計測できることで計測対象物の姿勢を判定することもできます。身近な例ではスマートフォンの姿勢判定(表向き、裏向き、縦、横、等)にも用いられています。

また、加速度グラフの波形は地磁気グラフに比べてギザギザですが、これは計測対象物の加減速に加えてセンサー自体の加減速を拾ってしまう為に計測値が結構暴れてしまうようです。

次に地磁気グラフです。まず最初に地磁気センサーが計測するデータについて確認しますと、地球が持つ磁場(磁界)の向きを計測します。主な用途としては方位を求めるのに用いられます。計測対象物の位置や方向が変化すると計測値も変化しますので、計測対象物の移動量がグラフに表れることになります。

そしてグラフを見てみますと、X軸(青)とY軸(ピンク)については加速度グラフよりも明確な周期波形を示していますが、Z軸(緑)は変化量が少ない周期波形を示しています。

扇風機の動作(風向き回転運動)の面から見ますと、鉛直面(XY平面)に対して角度無く回転していたならばZ軸の移動量はゼロになったはずです。しかし、グラフの結果はZ軸方向にも僅かに移動していたことを示しています。見た目に分かり辛い程度に回転面が傾いていたか、回転ムラ(波打つ)が有ったかもしれません。そして、X軸方向とY軸方向については同程度の移動量の反復であったことを示しているので、円周運動であったことが表れています。

地磁気センサーの計測データについて、もう少し分析を続けてみましょう。グラフにすると相対的な変動量が表れるので同じ運動を同じように計測した場合、波形はほぼ変わらないはずですが場所を変えると計測値自体は変化してしまいます。

計測値も相対的に評価できれば、何かしらのしきい値を決めたい場合等に有利になります。全体の中で個々の計測値がどの位置に居るかを相対的に評価するには、データを基準化(標準化)する方法があります。計測データを基準化して基準値を求める式は次の通りです。

基準値 =(データ - 平均値)÷ 標準偏差

基準化した地磁気グラフを作成します。

基準化した地磁気の1分間抽出グラフ(時計回り)
『基準化した地磁気の1分間抽出グラフ(時計回り)』

時計回りの時間帯から1分間を抽出しました。上図の2つのグラフは波形で見るとほぼ同じですが基準化するにあたり、上側は計測の全範囲を対象とし、下側は時計回りの時間帯のみを対象としています。よって単純に考えても平均値と標準偏差は異なります。下側の方が僅かながら基準値が小さめで変動幅も小さいです。

また、基準化していない地磁気グラフと比べるとZ軸グラフが顕著に異なっています。基準化することで各軸データ内での相対的な位置関係がグラフに表れた結果です。相対的な評価においては、センサー計測値のX軸、Y軸、Z軸の(相互の)スケール感が失われることになるので、その点には注意して利用しなければなりません。

2通りの対象範囲で基準化してみましたが、折れ線グラフでは違いが分かり辛かったので別の方法で分析してみます。なお、先に述べたように今回の計測においてはZ軸方向にも移動が有りましたが、以降は話を単純にする為にX軸とY軸の二次元を対象として話を続けます。基準化した地磁気データのX軸とY軸を用いて散布図を作成します。

地磁気 X軸とY軸による散布図
『地磁気 X軸とY軸による散布図』

上図の左側は計測全範囲を対象として基準化したデータのX軸とY軸から散布図を作成しています。対して右側は時計回りの時間帯のみを対象として基準化したデータのX軸とY軸から散布図を作成しています。

どちらもセンサーの動作を反映して円形にデータがプロットされています。ただ、右側の方がより真円に近いですね。やはり、停止状態や反時計回りといった異なる動作のデータを含まないので、より精度が高く再現できているようです。

また余談ですが、Power BI Desktopの散布図には再生軸の設定があり、これにタイムスタンプデータを指定するとアニメーションのように再生することができます。今回はドットが円周運動を行う様子を確認しました。

話が長くなってしまいましたが、これでも一例に過ぎません。ここまでの話のように収集したデータを基に分析した結果、目の前で見ていた動作(円周運動、回転数、回転方向、等)を導くことができました。

ただ、今回のデータ分析を「答え合わせ」のように感じ、データ分析によって既に分かっている事実が得られても価値を感じられない方もおられるかもしれません。データ分析によって「見えている事実」を確認するだけでなく「見えていない事実」を浮かび上がらせることができれば確かに良いですよね。

その為にも「見ていた動作がデータ上にどのように表れるのかを理解する」ことは第一歩として必要なステップとなります。それはデータに基づいて管理することに繋がります。例えば日常的にデータを監視することによって「正常であること」を判定したり、データの推移によって「潜在的な異常」を検知したりといった管理の実現に期待が持てます。

ここで押さえておくべきことは、判定や検知に際しては業務要件(どういった場合に、どのようにしたいのか)が密接に関わってくるということです。収集したデータは、それ自体は「材料」に過ぎず、業務要件による「意志」を伴うことで目的を持ったデータ分析が可能になります。

そういった点では、データ分析のプロセスには「様々な角度のデータから業務要件を明確に再確認する」アプローチもあるでしょうし、「業務要件を満たす為に、どのようなデータを更に収集すれば有利になるのか」といったアプローチもあるでしょう。画一的にならず、時には試行錯誤も含めたスパイラルな取り組みを行うことが、より良い成果をもたらしてくれるでしょう。

日常の活動からデータを収集しデータに基づいた管理を行うことは、スピーディーで効果的な意思決定を助けることに繋がります。それは言うまでもなく経営における競争力を高めてくれます。何も特別な考えを持たなくても、大切なデータは日常業務の中に存在していることでしょう。「何のデータが役立ちそうか」といった目線で改めて日常の業務を見直してみては如何でしょうか。

この記事のまとめ

  • センサーを用いて扇風機の動作からデータ収集を行った
  • 収集したデータを分析することを通して扇風機の動作を捉えられた
  • データと業務要件が揃うことで目的を持ったデータ分析が可能となる
  • データに基づいた管理は競争力の高い経営環境づくりに貢献する