Talend Blog

データガバナンスとメタデータ管理によりHadoopの道のりを切り開く6つのステップarticle in German

2月 21, 2017 - Jean-Michel Franco

この記事は、ビッグデータとHadoopの管理に焦点を当てた2部構成シリーズの第1回です。

データ駆動の旅に出発する準備ができていますか。 ビジネスケースとプロジェクトの青写真が明確に定義され、デジタルの変革に向けて経営幹部の支援もすでに取り付けています。 Hadoopに基づく最新のデータプラットフォームを実行する準備も整い、チームはビッグデータの明るい展望を組織内でより広く提供するためにスタート台についています。

Read More

Talendの「ジョブ設計パターン」とベストプラクティスarticle in Frencharticle in German

2月 21, 2017 - Dale Anderson

Talend開発者が、経験が浅かろうが豊富であろうが共通して直面することが多いのが、「このジョブを記述する最善の方法は何か」という疑問です。  効率的で、読みやすく、記述しやすく、何よりも(ほとんどの場合)維持しやすいものであるべきなのは当然です。 また、Talend Studioという自由形式の「キャンバス」では、コンポーネント、リポジトリーオブジェクト、メタデータ、及びリンケージオプションの包括的で多彩なパレットを使用してコードを「描画」できることもわかります。  では、ベストプラクティスを使用してジョブ設計を作成したことを、どのように確認したらよいのでしょうか。

Read More

ビッグデータガバナンスとメタデータ管理を成功させるためのTalendの5本の柱article in German

2月 09, 2017 - Jean-Michel Franco

本シリーズの前回の記事では、データガバナンスによりビッグデータイニシアティブを持続可能な成功に導くための6つの鍵を検討しました。 これらの6つのステップは、TDWIが最近発表した「Governing Big Data and Hadoop(ビッグデータの管理とHadoop)」というレポートで明らかにされたものです。 このレポートは、独立した立場から課題とベストプラクティスについて取り上げていますが、Talendによる課題への具体的な取り組みについては明記していません。シリーズ第2回となるこの記事では、前回述べた6つの重要課題に対して、Talend Data Fabricの統一プラットフォームを構成する各主要コンポーネントがどのように対処できるかについて説明します。これを、メタデータ管理のためのTalendの5本柱と呼びます。

Read More

Talend Data Preparationのバージョンの選択方法article in German

2月 09, 2017 - Jean-Michel Franco

IGartner社は、最近発表したセルフサービス型のデータプレパレーションに関するマーケットガイドの中で、「データ及び分析を提供する組織は、さまざまなコンテンツ作成者向けに俊敏でキュレーションされた社内外のデータセットを提供することによって、2019年までにビジネスのメリットを倍増できる」[1]と予測しています。[1].

現在の組織は膨大なデータを抱えていますが、ほとんどの企業は収集する情報の一部しか活用していません。 セルフサービス型のデータプレパレーション戦略を導入することで、組織全体でデータをより広く使用し、データ駆動型の文化を創出していくことができます。しかし、これは簡単なことではありません。 データヒーローとして組織をデータ駆動型ビジネスに変革することを目指すITリーダーにとって、データワーカーがほとんどの時間(推定で年間500時間、22,000ドルに相当)を、データから知見を得る前のデータの収集、修正、フォーマット処理に費やしているという事実は非常に大きな問題です。 さらに、データソースが制御されない形で拡散するリスクについても懸念があります。

Read More

ビッグデータプロジェクトを成功させる(そして、落とし穴を避ける)方法article in German

2月 07, 2017 - Guest Bloggers

本記事は、Advanced Performance Institute社の創業者兼CEO、Bernard Marr氏によるゲストブログです。

ビッグデータが世界を席巻している中、この「時流に乗る」道を選ばなければ恐竜同様に絶滅するであろう、という文句でこの記事を始めることも可能です。

ここ数年間にビッグデータについて書かれた数百の記事の始まり方も、このようなものでした。

そのような記事の多くは、有益な情報を盛り込んだ素晴らしいものです。

しかし、それは記事の書き出しとしては実に怠惰な方法です。このことは、今この記事を読んでいる皆さんの大部分がすでにご存じかと思います。

そもそも、このことをわかっているからこそ、皆さんは今この記事を読んでいるのではないでしょうか。

そのような文句は、たとえ真実(であり常套句)であったとしても、状況を簡単にとらえすぎています。

真実は、仮に「時流に乗る」ことを選択しても、成功の保証はないということです。

Read More

過去10年の成長を振り返ってarticle in German

2月 07, 2017 - Bertrand Diard

創業10周年とIPOの成功を祝う機会に恵まれた今、Talendの豊かな歴史を振り返り、クラウド及びビッグデータソフトウェアの世界的リーダーとしての地位確立に尽力した人々に敬意を表したいと思います。 語りつくされた感があることですが、Talendの成功は、本質的には当社に加わって現在でも「ファミリー」の一員として活躍している多くの人々の貢献によるものです。 Talendは、経営陣の選択にとどまらず、投資家、経営陣、そして当然のことながら顧客、パートナー、従業員から絶大な支持を得ています。

Read More

Apache Beamの紹介article in German

2月 06, 2017 - Jacob Spencer

この記事は、Apache Beamプロジェクトの包括的な目標と目的について説明するシリーズ第1回です。

今後のブログでは、Apache Beamを使用してデータ処理ジョブを実装する方法について説明していきます。

すでにビッグデータプラットフォームを使用中であれば、そのプラットフォームの継続的な進化が重要です。

現在Apache Hadoop MapReduceジョブを使用してデータを処理している場合、Apache Sparkに移行することで、新しい機能を活用してパフォーマンスを向上できます。

既存のバッチ処理機能に加えて、ストリーミングデータ処理を実装することもお勧めします。

または、簡単な統合パターンを探したり、他のテクノロジーにアップグレードしたりしてもよいでしょう。

たとえば、現在Apache Sparkを使用している場合は、何らかのユースケース向けとして、またはメリットを評価するための概念実証(PoC)の一環として、Apache Flinkを使用することを検討できます。

オンサイトでさまざまなランタイムを使用している場合、異なるテクノロジーの間での切り替えは非常に難しく、またコストがかかる場合があります。

Read More

Talendによる機械学習の促進 – 決定木についてarticle in German

1月 27, 2017 - Louis Frolio

決定木は、使いやすく、解釈しやすく、運用化しやすいことから、機械学習で幅広く使用されています。Bデータサイエンスと機械学習を対象とするサイトとして高い評価を受けているKD Nuggetsが最近発表した記事では、機械学習に役立つ「上位10」のアルゴリズムの1つとして決定木が選ばれています。

ほとんどの決定木アルゴリズムは、理解、使用、運用化が簡単であるだけでなく、次のような非常に便利な機能を含んでいます。

Read More

2016年Talendデータマスターズアワード:Lenovo社のデータ駆動型テクノロジーによる小売変革article in German

1月 27, 2017 - Martine Vesco

2015年、Talendはビッグデータとクラウド統合テクノロジーの革新的な使用によりビジネスを劇的に変革した企業を表彰する、年次のデータマスターズアワード(Data Masters Award)プログラムを導入しました。

今年のデータマスターのブログシリーズは、2016年11月17日にフランスのパリで開催されたTalend Connectカンファレンスで発表された、2016年データマスターズアワードの受賞企業に焦点を当てています。

デジタルマーケティングによる最大限のROIの実現、

人気商品の特定と販売方法、

オンラインストアでの需要の把握と提供といった課題は、

規模を問わずオンライン店舗と実店舗の両方のビジネスにとって難しい懸念事項となっています。

小売業は膨大な顧客データを持つ業界であるとは言え、企業は顧客ニーズを把握してリアルタイムのパーソナライズされた推奨情報を提供するために苦心しています。

これはまだ精密科学の分野ではありませんが、ビッグデータ、クラウド、リアルタイムの情報テクノロジーの支援によって少しずつ簡単になり始めています。

Read More

データ統合市場の現状を理解するarticle in German

1月 27, 2017 - Ashley Stirrup

データ統合市場は、時として理解しにくいことがあります。

多くの企業が競合しており、それぞれが市場に対して独自のアプローチを持っています。

42ページにわたるGartner社の『Gartner Magic Quadrant for Data Integration(データ統合に関するマジッククアドラント)』は市場を徹底的に分析していますが、このようなレポートでは環境を大局的にとらえにくい場合があり、

内容を入念に吟味することで興味深いパターンを見てとることができます。

私がレポートを検討したところ、ベンダーを

クロスエンタープライズ、統合スペシャリスト、ニッチプレイヤーの3つのカテゴリーに大別できました。

興味深いことに、レポートで調査対象となっている企業の過半数(14社中8社)がスペシャリストのカテゴリーに属します。

これは、IDC社の調査で、企業が提供する統合ソリューションの種類が平均4つであることが明らかになった理由の1つであると思われます。

Gartner社の評価には多くの変数が使用されていますが、各ベンダーの「強み」と「注意点」のセクションで特筆されている事項から、いくつかの変数が重要視されていることがわかります。

Read More

Talend “Job Design Patterns” & Best Practices ~ Part 4

1月 05, 2017 - Dale Anderson

Our journey in Talend Job Design Patterns & Best Practices is reaching an exciting juncture.  My humble endeavor at providing useful content has taken on a life of its own.  The continued success of the previous blogs in this series (please read Part 1,

Read More

Top 6 Technology Market Predictions for 2017

12月 22, 2016 - Ashley Stirrup

Big Data Will Transform Every Element of the Healthcare Supply Chain

The entire healthcare supply chain has been being digitized for the last several years. We’ve already witnessed the use of big data to improve not only patient care, but also payer-provider systems, reducing wasted overhead, predict epidemics, cure diseases, improve the quality of life and avoid preventable deaths. Combine this with the mass adoption of edge technologies to improve patient care and wellbeing such as wearables, mobile imaging devices, mobile health apps, etc.

Read More

Your ‘Resolution List’ for 2017: 5 Best Practices for Unleashing the Power of Your Data Lakes

12月 21, 2016 - Isabelle Nuage

As we all prepare for the New Year, what are the top priorities on your agenda for 2017? Are data lakes part of it? Are you looking for ways to do it right? Then we might be able to help you go through the holiday break with some food for thought.

Read More

4 Considerations for Delivering Data Quality on Hadoop

12月 20, 2016 - Nitin Kudikala

Organizations are increasingly trying to become data driven. In my last blog, I outlined steps organizations should take to become data driven using the Kotter Model.

Read More