データ統合開発者の一日[第5部]:ジョブ設計の基本機能

データ統合開発者の一日」シリーズ第5部となる今回は、Talend Studioでの基本的なジョブ設計機能に焦点を当てます。その中でも、最初にコンテキスト変数を取り上げます。

コンテキスト変数は非常に便利で、グローバルでもローカルでも使用できます。グローバルコンテキスト変数を使用するとジョブが動的になり、開発、テスト、または本番稼働からジョブを移行できます。

ディメンションロードプロセス内のいくつかのコンテキスト変数を見ていきましょう。

左側にいくつかのグローバルコンテキスト変数を定義しました。

Talend Studioのスクリーンショット

データベースサフィックスとファイル名のコンテキスト変数を開きます。このコンテキスト変数は、すべてのAirlineロードプロセス(ディメンションテーブルとファクトテーブルの両方)で使用されます。データベースのサフィックス、ファイル名、および場所を定義します。

さらに、異なる構成もあります。

Talend Studioのスクリーンショット

開発、本番、QAについて設定できるので、ロードする環境に応じて使用するコンテキスト変数を選択できます。コンテキスト変数は接続文字列の一部となり、ジョブ自体の中にファイルの場所が含まれます。

これにより、パラメーターに異なる構成を選択するだけで、コードを変更せずにジョブを移行できます。

ジョブをクリックして[Context]タブに移動すると、これらのコンテキスト変数がジョブにインポートされた場所がわかります。データベースサフィックスとファイルの場所を含むコンテキスト変数を確認できます。

Talend Studioのスクリーンショット

コンテキストを選択またはインポートしたら、どの構成を使用するかを選択できます。右上のアイコンを選択して、dev、qa、prodのいずれを使用するかを選択します。ここではdevを使用しています。

また、これらのコンテキスト変数がどのように使用されているかも確認できます。たとえば、この接続文字列は、airlineの末尾にデータベースサフィックスを使用しているので、使用する構成に応じてairline_devまたはairline_prodと呼ばれます。

次に、このプロセスを実行すると、参照コンテキストプロジェクトからインポートしたdevパスワードを使用して設定されたairline_devの構成またはデータベースにデータが入力されます。これが実行すると、dev Airlineディメンションテーブルが作成されロードされます。

このプロセスの詳細は、上のビデオをご覧ください。次回は、データ統合ジョブの自己文書化について紹介します。

| 最終更新日時: June 27th, 2019