フルリソースライブラリー

ETLテスト:概要

ETLテストとは、レコードの重複やデータの損失を防ぎながらデータの正確性の検証/確認/保証を行うために、ETLプロセス全体に適用されるテストを指します。ETLテストの8つの段階、9種類のテスト、一般的な課題、最適なツールの見つけ方などを紹介します。

詳細

Hadoopとは?

Hadoopは、Javaベースのオープンソースフレームワークであり、ビッグデータの格納と処理に使用されます。データは、クラスターとして動作する安価な汎用サーバーに格納されます。分散ファイルシステムにより、同時処理とフォールトトレランスが実現します。

詳細

MapReduceとは?

MapReduceは、Hadoopフレームワーク内のプログラミングモデル(パターン)であり、Hadoopファイルシステム(HDFS)に格納されたビッグデータにアクセスするために使用されます。map関数は、入力、ペア、プロセスを使用して、別の中間ペアのセットを出力として生成します。

詳細

ELTとETL:違いの定義

ETLとELTでは、データがビジネスインテリジェンスに変換される場所、そして運用中のデータウェアハウスに保持されるデータの量が異なります。ここでは、これらの違いがビジネスインテリジェンスにとって何を意味するのか、それぞれの組織にとって最適なアプローチはどちらか、なぜクラウドがすべてを変えているのかについて説明します。

詳細

Hadoop in the Enterprise

Hadoopはゴールデンタイムの準備ができている?

Hadoopはゴールデンタイムの準備ができている? 1,500名以上のビジネスインテリジェンス(BI )やデータ管理の専門家がHadoopの使用や体験を調査しました これはHadoopのメリットと課題に関する包括的なレビュー結果です。

今すぐダウンロード

IT意思決定者が注目すべき2017年以降の6つの重要トレンド

2016年の時点で、世界の総人口の半分がインターネットに繋がっており*、オンライン接続する機械は64億台を超えています**。あらゆる場所で膨大な量のデータが送受信されているのが現状です。Advanced Performance InstituteのBernard Marr氏により執筆された本ホワイトペーパーでは、人、モノ、企業のスマート化を実現する6つの重要なITトレンドについて解説します。

今すぐダウンロード

無料レポート:セルフサービス分析

今日の企業はデータに圧倒され、収集したデータのほんの一部の分析をかろうじて行っている状況にあります。そのような中、より強固なデータ駆動型文化の構築に向け、セルフサービス分析と呼ばれる新しいアプローチを採用する企業が増加しています。

今すぐダウンロード