ファイルのソート

このチュートリアルでは、処理コンポーネントを使用してファイルからのデータをソートする方法について説明します。

このチュートリアルでは、Talend Open Studio Data Integrationバージョン6を使用します。

1. 新しいジョブを作成する

  1. [Integration]パースペクティブが選択されていることを確認します。
  2. 新しいジョブを作成し、SortCSVFileという名前を指定します。

ジョブを含まないジョブデザイナーが開きます。

2. tFileInputDelimitedコンポーネントを追加・構成する

  1. tFileInputDelimitedコンポーネントをジョブに追加します。
  2. tFileInputDelimited_1コンポーネントを構成するには、コンポーネントの[Component]ビューで、[FileName]フィールドの横の[...]をクリックし、ローカルディスクからファイルを選択して、[Open]をクリックします。
  3. ファイルの構造を記述するには、tFileInputDelimited_1のスキーマウィザードを開き、[Edit schema]フィールドの横の[...]をクリックします。
  4. [+]アイコンをクリックして最初の列を追加し、その列の詳細を入力します。
  5. CSVファイルの各列について手順dを繰り返し、スキーマウィザードを閉じます。

3. ジョブのデータをソートする

  1. tSortRowコンポーネントをジョブに追加し、2つのコンポーネントをリンクします。

    注:tFileInputDelimited_1コンポーネントのスキーマは、リンクされたtSortRowコンポーネントにより継承されるため、構成する必要はありません。
    .
  2. 継承されたスキーマを表示するには、tSortRowコンポーネントの[Component]ビューで、[Edit schema]フィールドの横の[…]をクリックします。
  3. 映画の公開年に基づいて新しいソートルールを作成するには、[Schema column]で[+]をクリックして[releaseYear]をクリックし、ソート順として[desc]をクリックして指定します。
  4. ソートルールの結果を表示するには、ジョブデザイナーでtLogRowコンポーネントを追加し、tSortRow_1コンポーネントとtLogRow_1コンポーネントをリンクします。
  5. ジョブを実行するには、ジョブsortCSVFileの[Run]ビューで[Run]をクリックします。

これで、ソースファイルの映画が公開年でソートされます。

4. 第2のソートルールを追加する

  1. 第2のソートルールを追加するには、tSortRow_1コンポーネントの[Component]ビューで[+]をクリックし、[Schema column]で[title]を選択します。続いて、[sort num or alpha?]列で[alpha]を選択します。
  2. ジョブを実行するには、[Run]ビューで[Run]をクリックします。

これで、映画が公開年でソートされ、各年で映画はタイトルのアルファベット順にソートされます。

5. ジョブの結果をファイルに保存する

  1. tfileOutputExcelコンポーネントをジョブデザイナーに追加し、tLogRow_1をリンクします。
  2. 出力コンポーネントを構成するには、コンポーネントの[Component]ビューで出力ファイルのパスと名前を指定します。
  3. 出力ファイルにヘッダー行を含めるには、[Include header]のチェックをオンにします。
  4. ジョブを実行するには、[Run]ビューで[Run]をクリックします。
  5. moviesSorted.xlsファイルをチェックするには、ファイルが作成されたフォルダーに移動してファイルを開きます。ソートされたデータを含むファイルが表示されます。
  6. ソートされたデータが[Run]ビューに表示されないようにするには、[tLogRow_1]を右クリックし、[Deactivate tLogRow]をクリックします。
  7. ジョブを実行するには、[Run]ビューで[Run]をクリックします。

ジョブが再び実行されます。しかし、[Run]ビューにデータは表示されません。