データ統合開発者の一日[第3部]:実行、テスト、デバッグ

データ統合開発者の一日」シリーズ第3部となる今回は、プロセス(ジョブ)の実行、テスト、デバッグをすべてTalend Studioで操作する方法を見ていきます。ビデオと以下の説明では、複数の方法でのジョブの実行、小さなデータセットを使用したテスト、ロギング機能を使用したデバッグ、そしてStudioに組み込まれているデバッグ機能の使用方法を紹介します。

デバッグ方法その1

ここでは、大きなファイルからデータを読み込んで集約し、テーブルに書き出す単純なプロセスについて説明します。

Talend Studioのスクリーンショット

[Run]タブの[Debug Run]をクリックして、[Next]ボタンをクリックすると、ジョブが構築され、プロセスの実行が開始されます。データがそれぞれの変換で処理され、すべての属性を確認できます。

ファイルには複数の列が含まれ、tMapによって減らされます。処理されるデータ量が少なくなるようにデータセットを小さくしたいと思います。

ファイルの[Component]タブをクリックし、[Limit]フィールドに10を指定します。[Run]タブの[Debug Run]に戻ります。[Next]ボタンを10回クリックすると、わずか10個のレコードを使用して処理が実行されます。

デバッグ属性機能をすべてのコンポーネントで確認できます。これらをドラッグして移動すると、実際にデータベースに書き込まれた内容を簡単に見てとることができます。tMapで構築されているシーケンスもわかります。

デバッグ方法その2

プロセスをデバッグするもう1つの方法は、tLogRowコンポーネントを使用して画面出力をStudioに追加し、最後のtMapからの出力をtLogRowにリンクすることです。

出力行をtMapの新しい出力行に指定します。tMapに移動すると、tMapのtLogRowに移動させたい属性をドラッグアンドドロップで接続できます。

Talend Studioのスクリーンショット

シーケンスが正しく生成されていることを確認するには、新しい列にシーケンスを追加します。

Talend Studioのスクリーンショット

シーケンスを意味するようseqと名付けます。整数を指定する必要があるので、タイプをIntegerに変更します。次に、式ビルダーで関数を追加します。数値シーケンスを追加します。これで、シーケンスの準備ができました。

データを見やすく表示したい場合は、テーブル形式に変更できます。行を増やして、より多くの出力を表示することも可能です。ここでは、ファイル内の100行に変更します。通常の実行モードで実行すると、集約されたすべてのデータ出力とシーケンス番号が画面に表示されます。

これら2つのデバッグ方法の詳細は、上のビデオをご覧ください。次回のチュートリアルでは、基本的な設計機能について紹介します。

| 最終更新日時: June 26th, 2019