フルリソースライブラリー

ストリーミングデータとは?

Kafkaなどのストリーミングデータフレームワークによって、スケーラブルで柔軟な方法でストリーミングデータを移動/処理できるようになりました。

詳細

データ処理とは?

データ処理は、生の形態のデータを読み取り可能な形式に変換します。これによって、コンピューターがデータを解釈し、組織全体で従業員が活用できるようになります。

詳細

[ウェビナー]Talend Fall ’18の新機能

データが増えれば増えるほど、業務で使用できる環境の準備が難しくなり、さらに管理コストも増加するという問題があります。 しかし、Talend Fall ‘18の登場で、それも過去の話となります。東京のクラウドセンター、サーバーレスビッグデータをはじめとする新機能が問題を解決します。

今すぐ見る

ビッグデータの未来

ビッグデータとは、業務を改善するために莫大な量のデジタル情報を収集、分析、使用することを指す一般的な用語です。ビッグデータによって、私たちの生き方、ショッピング、そして日常生活のアプローチが急速に変化しています。ビッグデータとはどのようなもので、どのように活用できるのかを説明します。

詳細

ETLテスト:概要

ETLテストとは、レコードの重複やデータの損失を防ぎながらデータの正確性の検証/確認/保証を行うために、ETLプロセス全体に適用されるテストを指します。ETLテストの8つの段階、9種類のテスト、一般的な課題、最適なツールの見つけ方などを紹介します。

詳細

データレイクとは?

データレイクは、多数のソースからのビッグデータを元のままの形式で保持する中央ストレージリポジトリです。データレイク形式のメリットは魅力的であり、多くの組織がデータウェアハウスからデータレイクに切り替えています。データレイクの特長、データレイクの使用が拡大している理由、データレイクを構築する方法について紹介します。

詳細

機械学習とは?

機械学習とは、さまざまな外部入力への露出を介して、時間をかけて「学習」する能力をコンピューターに与えるための、統計的確率を用いた手法です。

詳細

データプロファイリングとは?

データプロファイリングはビジネスに不可欠です。データプロファイリングを使用してデータを編成/分析する企業は、新たな成功につながる可能性を発見し、市場で明確かつ強力な優位性を発揮できます。

詳細

Hadoopとは?

Hadoopは、Javaベースのオープンソースフレームワークであり、ビッグデータの格納と処理に使用されます。データは、クラスターとして動作する安価な汎用サーバーに格納されます。分散ファイルシステムにより、同時処理とフォールトトレランスが実現します。

詳細

データレイクとデータウェアハウス

データレイクとデータウェアハウスは、どちらもビッグデータを格納するために広く使用されていますが、同じものではありません。データレイクは、ローデータの巨大なプールですが、その目的はまだ定義されていません。データウェアハウスは、特定の目的のために処理され、フィルタリングされた構造化データのリポジトリーです。

詳細

MapReduceとは?

MapReduceは、Hadoopフレームワーク内のプログラミングモデル(パターン)であり、Hadoopファイルシステム(HDFS)に格納されたビッグデータにアクセスするために使用されます。map関数は、入力、ペア、プロセスを使用して、別の中間ペアのセットを出力として生成します。

詳細

ELTとETL:違いの定義

ETLとELTでは、データがビジネスインテリジェンスに変換される場所、そして運用中のデータウェアハウスに保持されるデータの量が異なります。ここでは、これらの違いがビジネスインテリジェンスにとって何を意味するのか、それぞれの組織にとって最適なアプローチはどちらか、なぜクラウドがすべてを変えているのかについて説明します。

詳細

Hadoop in the Enterprise

Hadoopはゴールデンタイムの準備ができている?

Hadoopはゴールデンタイムの準備ができている? 1,500名以上のビジネスインテリジェンス(BI )やデータ管理の専門家がHadoopの使用や体験を調査しました これはHadoopのメリットと課題に関する包括的なレビュー結果です。

今すぐダウンロード

Talendのビッグデータ活用基盤で機械学習を効率化する

AIや機械学習の普及は加速度的に進んでおり、企業活動のあらゆるところでAI導入事例を目にするようになってきました。 AI導入が企業の競争力強化に必要不可欠な時代に突入しています。その一方で、専門的スキルをもつ人材の不足、業務オペレーションとは分断されたデータ活用などの理由により、AI活用には効率化の余地が多くあります。

今すぐ見る

TalendとCloudera Altusを活用した データパイプライン構築

TalendとClouderaはビッグデータプロジェクトの管理を簡素化し、クラウドへの移行リスクを軽減し、より簡単にHadoopとSparkの処理能力を引き出せるようにします。 Cloudera Altus、新しい「big data as a service platform」は、大規模なデータ処理アプリケーションをパブリッククラウドでの実行を簡単にします。TalendはCloudera Altusとネイティブに連携する最初のデータ統合ソリューションです。

今すぐ見る


ページを表示しています of 2