データモデルの設計とベストプラクティス(第2部)
データモデルとは何を指すのでしょうか。毎日データモデルに接して熟知しているTalendの開発者は、以下のようにデータモデルを定義しています。 ビジネスシステムデータの構造的定義 ビジネスデータのグラフィカルな表現 ビジネスソリューションを構築するためのデータ基盤 これらはいずれも真実かも...
記事を読む
ビッグデータの波に乗る:「Forrester Wave™: Big Data Fabric, Q2 2018」から得られる3つの注目点
フォレスターが発表した今回のForrester Waveレポートは、データ市場で大きな変化が起こっていることを再び証明する形となりました。 新しいイノベーションによって、データからより大きな価値をかつてない速さで得られるようになってきています。 わずか18か月で、新しい変化の波が起こっているのです。このレポートで注目すべきポイントは次の3点です。...
記事を読む
Apache SparkとTalend:パフォーマンスと調整




このブログシリーズでは、すでに2つの記事でTalendとApache Sparkに関して説明してきました。 このブログシリーズのこれまでの記事をまだ読んでいない場合は、最初に第1部「TalendとApache Spark:技術的な手引きと概要」と第2部「Talend Sparkジョブ vs. spark-...
記事を読む
Apache Sparkのパーティショニングの基礎知識




Apache SparkのResilient Distributed Dataset(RDD)は、サイズが大きすぎて1つのノードに収まらないため、複数のノードに分割する必要があるさまざまなデータの集合です。Apache Sparkは自動的にRDDをパーティションに分割し、複数のノードに分散します。この操作は遅延評価され(たとえば、アクションがトリガーされ...
記事を読む
をダウンロードする
詳細
Pipeline Designerの紹介:データ統合の革新



Pipeline Designerがリリースされました。この次世代クラウドデータ統合設計環境を使用することで、開発者はデータパイプラインを数分で開発/展開し、バッチとストリーミングのユースケース全体でシームレスに設計し、最新のハイブリッドおよびマルチクラウドテクノロジーでネイティブに拡張できます。...
記事を読む
TalendとApache Spark:技術的な手引きと概要




Talendのカスタマーサクセスアーキテクトチームに加わる前の数年間は、サポートエンジニアとして、Apache SparkでのTalendの機能についてお客様からよく質問を受けました。Sparkについて話すとき、最初に頭に浮かぶのはspark-submitコマンドです。これはSparkジョブをサブミットするために使用するものです。そのため、TalendのSparkジョブと通常のspark-submitの対応についての疑...
記事を読む
LambdaからKappaまで:リアルタイムビッグデータアーキテクチャーのガイド




今日では、リアルタイムビッグデータアーキテクチャーを選べるようになっています。現在の選択肢はLambdaだけではありません。このブログシリーズでは、これら2つの選択肢について説明し、関連するユースケースで比較します。リアルタイムプロジェクトに適したアーキテクチャーを選択する方法について紹介します。 リアルタイムの要件 アーキテク...
記事を読む
クラウドにおける「管理されたデータレイク」

投稿者:Dale T. Anderson(Talend、リージョナルマネージャー、カスタマーサクセスアーキテクト)、Kent Graziano(Snowflake社、シニアテクニカルエバンジェリスト) ここでは、データレイクの構...
記事を読む
Dive Deeper
Learn how to empower your business users with easy-to-use, self-service integration tools.
Learn Moreエッジ分析 – ローカルで即座にインサイトを得ることのメリットとデメリットについて
IoTでのデータの保存と処理を取り上げた前回のブログに関連して、多くのデータサイエンティストから質問が寄せられました。その多くは、データの扱いについて困っているという内容のものでした。企業内のデータを保存すべきか破棄すべきか、また、保存する場合に戦略的資産とするための最善策は何かということが、共通の課題となって...
記事を読む
Apache SparkとTalendを使用してHadoopにOracle及びMySQLデータベースをオフロードする方法
ビッグデータの分野では、従来のデータウェアハウスをHadoop環境にオフロードすることが一般的です。一次使用向けの場合も、「コールドデータ」を保存するためだけの場合も、Talendは負担のないオフロードを実現します。 データアーキテクチャーを最適化しようとする多くの組織は、Hadoopをコールドデータに利用したり、アーカイブの維持のために使用したり...
記事を読む