データ統合開発者の一日[第1部]

データ統合開発者が、可能な限り迅速かつ費用対効果の高い方法でデータをつなげるには、使いやすく、データプラットフォーム全体でデータを同期させ、データの精度を向上させることが可能なオープンソースツールが必要です。そこで役立つのがTalend Studioです。

このビデオシリーズでは、典型的なデータ統合プロジェクトの開発サイクル全体でStudioの高度な機能がどのように使用されるかを紹介します。ジョブの構築、プロセスのテストとデバッグ、ランタイム環境でのジョブの展開と管理、環境間での開発を容易にするプロセスのスケジューリング、高度なチーム開発機能について説明します。

以下のチュートリアルで手順を追っていくことで、データ統合開発者の作業の効率化について理解できます。

Talend Open Studioの紹介

まず、Talend Studioのルックアンドフィールに慣れ、いくつかの重要な機能の使い方について一般的な知識を得ます。Talendのデータ統合プラットフォームは複数のコンポーネントで構成されていますが、その中の1つであるStudioから見ていきます。

Studioを初めて起動すると、接続を選択し、続いて既存のプロジェクトを開くかインポートするか、または新しいプロジェクトを作成するかを選択するよう求められます。このデモでは、既存のプロジェクトを使用します。

Talend Studioのスクリーンショット

開始画面が表示されます。すでにジョブを開始しているので、[Latest items]リストからジョブを開きます。初めてTalend Studioを開くと、プログラムのガイダンスで重要ポイントが紹介されます。また、Studioに慣れるためのデモプロジェクトも開きます。ガイダンスが改めて必要な場合は、[Help]ドロップダウンからツアーを再開できます。

Talend Studioでのジョブフローの構築

Talend Studioの機能がどのように作用するのかを確認するため、新しいジョブフローを作成します。

まず、Talend Studioがジョブの設計に使用される技術的項目に関連するデータを収集するリポジトリを見てみましょう。ここでは、作成したメタデータ、データベース接続、データベーステーブル、列、ジョブを管理できます。

中央のデザインワークスペースには、ソースコンポーネントのメタデータをドラッグアンドドロップして、すでに取り込んでいます。デザインワークスペースは、ジョブをレイアウトして設計する場所です。右側にはコンポーネントパレットがあります。ここには、ジョブの構築に使用される技術コンポーネントを含むがまとめられています。

Talend Studioのスクリーンショット

コンポーネントは、特定のデータ統合操作を実行するために使用される事前構成済みのコネクターです。複数のソースからのデータを使用するために必要とされるハンドコーディングを最小限に抑えることができます。ドリルダウンすると、さまざまな接続、データベース、およびアプリケーションをすべて確認できます。

このSalesforceOutputコンポーネントをパレットに追加して、ソースコンテンツのターゲットを作成しましょう。

Talend Studioのスクリーンショット

次に、これら2つのコンポーネントをtMapのようなものを使用して接続し、ソースとターゲットの間で属性をマップできるようにする必要があります。

  1. ソースをクリックします。
  2. ドラッグアンドドロップします。
  3. tMapに接続します。
  4. tMapを右クリックします。
  5. ターゲットへとドラッグアンドドロップします。
  6. 出力に名前を付けます。
  7. セットアップが完了したら、tMapコンポーネントをダブルクリックしすると、作成したSalesforceの接続に関するメタデータの属性が表示されます。
  8. これらの属性を左側のソースからドラッグして接続します。

これで、デザインウィンドウでプロセス(ジョブ)が機能するようになりました。構成タブ内でジョブの詳細を確認します。

詳細は、上の短いビデオをご覧ください。次に、Talend Studioで最初のジョブを構築する方法について説明します。

| 最終更新日時: June 26th, 2019