IoTの予測保守のPOC

Talend Big Dataと機械学習のクックブック

シリーズのほかのブログ:

Sandboxのセットアップ

リアルタイムのリスク評価レコメンデーションエンジンデータウェアハウス最適化

はじめに

この例では、5万台を超える自動販売機を所有する大企業が、IoT(モノのインターネット)と機械学習のパワーを活用して個々の販売機が故障する確率を判断する方法を説明します。同社は、すべての自動販売機にIoTセンサーを埋め込むことに投資しました。これにより、特定のデータポイントが収集され、分析のために中央データリポジトリに送り返されます。この例では、生データファイルを使用してIoTデータ収集リポジトリをシミュレートしています。データファイルを入力として使用し、Talendの機械学習機能を使用して、故障を防ぐために販売機の保守が必要かどうかを予測できるモデルを構築します。

SandboxのIoT予測保守スキーマ


主なトピック

機械学習

Talendの機械学習機能を利用して、ランダムフォレストモデルを構築します。

Sparkでの拡張

Sparkを使用してジョブを実行し、その拡張可能なアーキテクチャーと分散コンピューティングのパワーを活用します。

IoTのアイコン

IoTデータ

予測保守のためにIoTデータの使用方法を確認します。


実行

Sandboxのロードページから[IoT Predictive Maintenance]ユースケースポータルにアクセスして、簡単な指示とインタラクティブWebインターフェイスを利用します。

Sandboxの[IoT Predictive Maintenance]ロードページ

Sandbox環境内でTalend Studioを開きます。この例では、リポジトリビューの[IoTPredictiveMaintenance]フォルダーを使用します。[Standard][Big Data Batch]のジョブ設計で、ジョブについて探索します。開始する準備ができたら、以下のステップに従ってください。

  1. [Standard]ジョブの下の[IoTPredictiveMaintenance]フォルダーにナビゲートします。ジョブStep_01_SetupEnvironmentを実行します。このジョブは、選択したビッグデータプラットフォームに基づいてデモ環境を初期化します。具体的には、データをHDFSにロードして、トレーニングデータセットとテストデータセット、さらにデモ用Webページで使用する第3のデータセットを作成します。SandboxのIoT予測保守環境セットアップ
  2. [Big Data Batch]ジョブの下の[IoTPredictiveMaintenance]フォルダーにナビゲートします。ジョブStep_02_Train_PredictiveMaintenanceを実行します。このステップでは、tRandomForestModelコンポーネントを使用して、前のデータセットに基づいてモデルを訓練します。モデルはHDFSに保存されます。SandboxのIoT予測保守訓練モデル
  3. オプション:[Big Data Batch]ジョブの下の[IoTPredictiveMaintenance]フォルダーにナビゲートします。ジョブStep_02bis_Test_PredictiveMaintenanceを実行します。このジョブの結果は、誤検知に対する正しい予測の比率を示します。これは、機械学習の専門用語で混同またはエラーマトリックスと呼ばれ、分類の問題に関する予測結果の要約です。90%以上の正解率を得る必要があります。このジョブは、別のデータセットで訓練されたモデルのテストとして機能します。SandboxのIoT予測保守テストモデル
  4. [Big Data Batch]ジョブの下の[IoTPredictiveMaintenance]フォルダーにナビゲートします。ジョブStep_03_PredictMachinesMaintenanceを実行します。このジョブは、シミュレートされた「ライブ」データセットを使用して、前に訓練・テストされたモデルに基づいて自動販売機に必要とされる保守を予測します。SandboxのIoT予測保守販売機予測
  5. [Standard]ジョブの下の[IoTPredictiveMaintenance]フォルダーにナビゲートします。ジョブStep_04_WebServiceを実行します。このジョブは、単にデモ用ポータルページにWeb APIを提供するものであり、これにより結果を確認できるようになります。SandboxのIoT予測保守Webサービス
  6. Webサービスが実行されている状態で、[IoT Predictive Maintenance]ポータルページにナビゲートするか再ロードして、モデルによって故障が予想されるすべての販売機が表示されます。これらの販売機は予防保守を必要とします。自動販売機ダッシュボード

まとめ

この例では、インテリジェントな予測を実行するためのIoTセンサーデータと機械学習の併用について取り上げました。Talend Big Data IntegrationとSpark処理を組み合わせることで、迅速で信頼性の高いパフォーマンスを実現するための堅牢でスケーラブルなソリューションを提供できます。今回は、自動販売機が故障する前に保守の必要性を予測できました。

| 最終更新日時: June 26th, 2019