Talend Blog

Apache SparkとTalendを使用してHadoopにOracle及びMySQLデータベースをオフロードする方法article in German

3月 21, 2017 - Guest Bloggers

 

ビッグデータの分野では、従来のデータウェアハウスをHadoop環境にオフロードすることが一般的です。一次使用向けの場合も、「コールドデータ」を保存するためだけの場合も、Talendは負担のないオフロードを実現します。

データアーキテクチャーを最適化しようとする多くの組織は、Hadoopをコールドデータに利用したり、アーカイブの維持のために使用したりしています。 Talendは、Hadoopのネイティブコード生成によってこのプロセスを容易にすることができます。

Read More

A First for Apache Beam

3月 05, 2017 - Laurent Bride

At Talend, we like to be first. Back in 2014, we made a bet on Apache Spark for our Talend Data Fabric platform which paid off beyond our expectations. Since then, most of our competitors tried to catch-up…

Read More

[VIDEO] Modern Data Management Needs a Governed, Self-Service Approacharticle in French

3月 01, 2017 - Guest Bloggers

IT Pros, have you felt left out of technical lately? Yes? You are not the only one.

Read More

データガバナンスとメタデータ管理によりHadoopの道のりを切り開く6つのステップarticle in German

2月 21, 2017 - Jean-Michel Franco

この記事は、ビッグデータとHadoopの管理に焦点を当てた2部構成シリーズの第1回です。

データ駆動の旅に出発する準備ができていますか。 ビジネスケースとプロジェクトの青写真が明確に定義され、デジタルの変革に向けて経営幹部の支援もすでに取り付けています。 Hadoopに基づく最新のデータプラットフォームを実行する準備も整い、チームはビッグデータの明るい展望を組織内でより広く提供するためにスタート台についています。

Read More

Talendの「ジョブ設計パターン」とベストプラクティスarticle in Frencharticle in German

2月 21, 2017 - Dale Anderson

Talend開発者が、経験が浅かろうが豊富であろうが共通して直面することが多いのが、「このジョブを記述する最善の方法は何か」という疑問です。  効率的で、読みやすく、記述しやすく、何よりも(ほとんどの場合)維持しやすいものであるべきなのは当然です。 また、Talend Studioという自由形式の「キャンバス」では、コンポーネント、リポジトリーオブジェクト、メタデータ、及びリンケージオプションの包括的で多彩なパレットを使用してコードを「描画」できることもわかります。  では、ベストプラクティスを使用してジョブ設計を作成したことを、どのように確認したらよいのでしょうか。

Read More

When It Comes to Big Data and Cloud, Continuous Innovation is the Model

2月 21, 2017 - François Mero

During the 2008 election campaign, Barack Obama denounced his opponents for advocating “change” as an electoral argument while belonging to the government party that “had changed nothing.” He approached the situation with humor, employing an expression well-known across the Atlantic: “Y

Read More

Stripping Websites and Translating Text using Talend and Google Translate API

2月 16, 2017 - Guest Bloggers

Recently I developed a proof of concept ETL job to strip product information from a website, translate it, and create a data set comprising the original text and the translated text. 

Read More

ビッグデータガバナンスとメタデータ管理を成功させるためのTalendの5本の柱article in German

2月 09, 2017 - Jean-Michel Franco

本シリーズの前回の記事では、データガバナンスによりビッグデータイニシアティブを持続可能な成功に導くための6つの鍵を検討しました。 これらの6つのステップは、TDWIが最近発表した「Governing Big Data and Hadoop(ビッグデータの管理とHadoop)」というレポートで明らかにされたものです。 このレポートは、独立した立場から課題とベストプラクティスについて取り上げていますが、Talendによる課題への具体的な取り組みについては明記していません。シリーズ第2回となるこの記事では、前回述べた6つの重要課題に対して、Talend Data Fabricの統一プラットフォームを構成する各主要コンポーネントがどのように対処できるかについて説明します。これを、メタデータ管理のためのTalendの5本柱と呼びます。

Read More

Talend Data Preparationのバージョンの選択方法article in German

2月 09, 2017 - Jean-Michel Franco

IGartner社は、最近発表したセルフサービス型のデータプレパレーションに関するマーケットガイドの中で、「データ及び分析を提供する組織は、さまざまなコンテンツ作成者向けに俊敏でキュレーションされた社内外のデータセットを提供することによって、2019年までにビジネスのメリットを倍増できる」[1]と予測しています。[1].

現在の組織は膨大なデータを抱えていますが、ほとんどの企業は収集する情報の一部しか活用していません。 セルフサービス型のデータプレパレーション戦略を導入することで、組織全体でデータをより広く使用し、データ駆動型の文化を創出していくことができます。しかし、これは簡単なことではありません。 データヒーローとして組織をデータ駆動型ビジネスに変革することを目指すITリーダーにとって、データワーカーがほとんどの時間(推定で年間500時間、22,000ドルに相当)を、データから知見を得る前のデータの収集、修正、フォーマット処理に費やしているという事実は非常に大きな問題です。 さらに、データソースが制御されない形で拡散するリスクについても懸念があります。

Read More

ビッグデータプロジェクトを成功させる(そして、落とし穴を避ける)方法article in German

2月 07, 2017 - Guest Bloggers

本記事は、Advanced Performance Institute社の創業者兼CEO、Bernard Marr氏によるゲストブログです。

ビッグデータが世界を席巻している中、この「時流に乗る」道を選ばなければ恐竜同様に絶滅するであろう、という文句でこの記事を始めることも可能です。

ここ数年間にビッグデータについて書かれた数百の記事の始まり方も、このようなものでした。

そのような記事の多くは、有益な情報を盛り込んだ素晴らしいものです。

しかし、それは記事の書き出しとしては実に怠惰な方法です。このことは、今この記事を読んでいる皆さんの大部分がすでにご存じかと思います。

そもそも、このことをわかっているからこそ、皆さんは今この記事を読んでいるのではないでしょうか。

そのような文句は、たとえ真実(であり常套句)であったとしても、状況を簡単にとらえすぎています。

真実は、仮に「時流に乗る」ことを選択しても、成功の保証はないということです。

Read More

過去10年の成長を振り返ってarticle in German

2月 07, 2017 - Bertrand Diard

創業10周年とIPOの成功を祝う機会に恵まれた今、Talendの豊かな歴史を振り返り、クラウド及びビッグデータソフトウェアの世界的リーダーとしての地位確立に尽力した人々に敬意を表したいと思います。 語りつくされた感があることですが、Talendの成功は、本質的には当社に加わって現在でも「ファミリー」の一員として活躍している多くの人々の貢献によるものです。 Talendは、経営陣の選択にとどまらず、投資家、経営陣、そして当然のことながら顧客、パートナー、従業員から絶大な支持を得ています。

Read More

Edge Analytics – The Pros and Cons of Immediate, Local Insight

2月 07, 2017 - Zeeshan Javeed

A number of data scientists reached out to me about data storage and processing as discussed in my last blog around ‘IoT’.

Read More

Apache Beamの紹介article in German

2月 06, 2017 - Guest Bloggers

この記事は、Apache Beamプロジェクトの包括的な目標と目的について説明するシリーズ第1回です。

今後のブログでは、Apache Beamを使用してデータ処理ジョブを実装する方法について説明していきます。

すでにビッグデータプラットフォームを使用中であれば、そのプラットフォームの継続的な進化が重要です。

現在Apache Hadoop MapReduceジョブを使用してデータを処理している場合、Apache Sparkに移行することで、新しい機能を活用してパフォーマンスを向上できます。

既存のバッチ処理機能に加えて、ストリーミングデータ処理を実装することもお勧めします。

または、簡単な統合パターンを探したり、他のテクノロジーにアップグレードしたりしてもよいでしょう。

たとえば、現在Apache Sparkを使用している場合は、何らかのユースケース向けとして、またはメリットを評価するための概念実証(PoC)の一環として、Apache Flinkを使用することを検討できます。

オンサイトでさまざまなランタイムを使用している場合、異なるテクノロジーの間での切り替えは非常に難しく、またコストがかかる場合があります。

Read More

How to Offload Oracle and MySQL Databases into Hadoop using Apache Spark and Talendarticle in German

2月 01, 2017 - Guest Bloggers

 

In the space of Big Data, a common pattern found is offloading a traditional data warehouse into a Hadoop environment. Whether it be for primary use or to only store “cold” data, Talend makes it painless to offload.

Read More