データベース統合とは?

データベース統合は、複数のソース(ソーシャルメディア、IoTからのセンサーデータ、データウェアハウス、顧客のトランザクションなど)からの情報を集約し、組織全体でクリーンで最新のデータを共有するために使用されるプロセスです。データベース統合は、あらゆる共有情報のホームベースとなります。

データベース統合の図

たとえば、2つの企業が合併する場合、それまで個別に存在していたデータベースには、新しく結成される組織を運営するための重要なデータが含まれています。データベースの統合によって、データの重複が排除され、定義されたルールに従ってデータが格納され、クレンジングが行われ、ステークホルダーとの間で安全に共有されます。

クラウドが業務の新しい標準となり、ビッグデータがビジネスインテリジェンスや加速するデジタル市場での競争力を推進する中で、データベース統合は、企業がデータに圧倒されずに効率的に活用するうえで重要な役割を果たします。

Watch The Rise of Cloud Integration Platforms now.
今すぐ見る

データベース統合のメリット

データは現代のビジネスの支柱であり、デジタルのやりとりが物理的な場所やサーバーやルーターといった物理インフラストラクチャーに置き換わっています。

適切に管理されたデータベースプロセスによって、以下の課題から業務の改善がもたらされています。

  • 普遍的な信頼性を持つビジネスデータ - 量的に制限のない異種のソースを使用してデータの取り込み、クレンジング、保護、再共有を行うことで、グローバルに事業展開する企業でもビジネスにおけるデータの一貫性を維持できます。
  • 包括的な運用監視 - 中央の視覚化された運用画面からビジネス全体のインテリジェンスを管理することで、ボトルネックを特定し、ユーザーエクスペリエンスと顧客サービスを向上し、デリバリーサイクルを短縮します。
  • 簡素化されたセキュリティ - セキュリティ侵害事件のニュースが注目を集める中、企業は隔離されたオンプレミスネットワーク環境以外にも多くの侵入ポイントと大きな脅威に直面しています。集中的なデータベース統合を展開することで、最終バージョンのデータが投入され、そこから単一のソースとして発信されるため、重要情報の保護のためのプロセスが大幅に簡素化されます。
  • 容易に対応可能なコンプライアンス - 現代のデジタルビジネスは、HIPAA、PCI、GDPRなど、国内および国際的な運用基準に準拠するために、増大する責任を負っています。データベース統合は、企業内のコンプライアンスを確実にするための集中管理を提供します。

上記をはじめとする方法により、組織はデータ統合プラットフォームのバックボーンとしてデータベース統合を使用し、生の情報をビジネスインテリジェンスに変換しています。

現代のIT環境におけるデータベース統合

従来の「サーバールームから」の組織運営は、廃れたわけではありません。しかし、データベース統合の次なる波の原動力となるのはクラウドテクノロジーです。

どのような手法で展開するかは、通常は既存の運営により異なります。たとえば、レガシーのオンプレミスデータセンターを持つ企業は、おそらく運営の再編成を最小限に抑えるためにローカルデータベース統合ソリューションを選択するでしょう。反対に、比較的新しい企業は、効率的な価格体系、無限のスケーラビリティ、ハードウェアの初期投資を必要としないクラウドネイティブ環境を利用しています。その中間の企業は、ハイブリッドのアプローチにより、ローカルのレガシーアーキテクチャーとクラウドの間のギャップを埋めることができます。

オンプレミスのデータベース統合

オンプレミスのデータベース統合は、従来のオンサイトネットワークインフラストラクチャーをサポートします。スタンドアロン製品として販売されることも多いオンプレミスソリューションは、ローカルにインストールされ、既存のハードウェアやデータベースとやりとりして、ビジネスインテリジェンスを得るためにデータのクレンジング、監視、変換を行います。

オンプレミスのソリューションはすべてのデータ運用をローカルで処理するため、ネットワークのオーバーヘッドを軽減します。さらに、共通のデータソースとのインターフェイスのために組み込みコネクターを使用することで即座に運用を開始できるようにすることを目指しています。一般的なオンプレミスソリューションでは、共通の製品ラインの開発者との間で、頻繁にアップグレードして接続を確保するための作業契約が必要となります。

クラウドのデータベース統合

クラウドのデータベース統合ソリューションは、クラウドネイティブであり、インフラストラクチャーの一部として実行され、企業全体で発生するすべてのデータトランザクションとバックグラウンドでやりとりします。

この手法は、自動スケーリングと従量制の料金体系を含むクラウドアーキテクチャーの標準的なメリットを提供します。クラウドのデータベース統合の主なメリットは、SaaSソリューションが環境内のほかのデータベースだけでなく仮想インフラストラクチャーやセキュリティとも、ほぼシームレスにやりとりすることです。これによって、業務全体をリアルタイムに把握できます。

ハイブリッドのデータベース統合

ハイブリッドのデータベース統合は、オンプレミスとクラウドの要素を組み合わせて、ローカルとリモートでホストされるリソースの間でデータを同期/管理するクラウドベースSaaSを活用するアプローチです。

優れたデータベース統合ソリューションは、クラウドベースのデータとオンプレミスのデータを相互に関連付けてクレンジングし、混在環境全体で統一された作業情報を提供します。理想的なソリューションは、ほかのSaaSソリューションとシームレスに連携し、シンプルなGUIインターフェイスを提供し、あらゆる業務とやりとりに関する360°のビューを意思決定者に提供します。

どの方法を選ぶ場合も、ネットワークの遅延を発生させずにリアルタイムのビジネスインテリジェンスを得られるようになるには、慎重な計画、強力なパートナーシップ、そして適切なツールの使用が重要な鍵となります。

データベース統合ツール

クラウド自体は、分散ストレージ、処理、データ管理を安価でアクセスしやすいものにする、コラボレーションによるオープンソースのデータテクノロジーから生まれたものです。クラウドコンピューティングやハイブリッドコンピューティングで最も活用されている主要コンポーネントの多くは、オープンソーステクノロジーに基づいています。

Apache Software Projectほど、クラウドの成長を促進し安全性を確保するために尽力してきた組織はほかに存在しないのではないでしょうか。コミュニティにより開発されたプロジェクトの多くは、Netflix、GitHub、欧州原子力研究機関(CERN)など、世界最大規模のビッグデータ運用の基盤となっています。

オープンソースソフトウェア

その中でも、以下の3つのApacheツールがデータベース統合の大部分を担っています。

  1. Apache Hadoop - Hadoopは分散処理のためのフレームワークであり、ペタバイト規模の情報を無限の数の物理/仮想サーバーに分割し、一括処理した後、クリーンで信頼性の高いデータとして返すことができます。

    HadoopはJava言語に基づきますが、オープンソースであり、ビジネスニーズに対応する拡張機能や改造機能のライブラリを備えています。Hadoopは、ネイティブのファイル管理システム、リニアなスケーラビリティ、フェイルオーバーの保護機能を提供するので、1つのデータストリームで障害が発生しても、並列ノードによって補完されます。

  2. Apache Spark - SparkはHadoopの新しい代替と考えられることもありますが、現実にはHadoopに連携させて使用するツールです。Sparkは、MapReduceと呼ばれるHadoopの分散処理フレームワークを改善し、最大100倍の速度でデータを処理します。

    Sparkはそのために、物理的な場所や仮想の場所に転送して変換するのではなく、メモリ内でほとんどのデータタスクを処理します。しかし、Sparkには独自のファイル管理システムが組み込まれていないため、Sparkが提供する機能は速度がいくらか制限されます。Sparkは、ほかのファイル管理システムと統合でき、Hadoopのファイルシステムともシームレスに連携できます。

  3. Apache Cassandra - おそらくビッグデータの根源となるのは、NoSQLデータベースでしょう。NoSQLは、異種のストレージタイプを可能にし、テキスト、イメージ、マルチメディアなどの多様なファイル形式間のデータベースの統合を実現することで、カラム型データベースやリレーショナルデータベースの制約を排除した、情報処理の進化形です。

    Cassandraは、オープンソースで無制限のスケーラビリティを可能にする柔軟性を備えています。10ペタバイト以上のデータを統合するための分散フレームワークとして利用しているAppleをはじめ、巨大企業のニーズにも対応します。

O’Reilly Report: Moving Hadoop to the Cloudをダウンロードする
今すぐダウンロード

データベース統合のための最適なパートナーの選択

データ統合では、コネクターやSaaSの依存関係をApache(または同様の)フレームワークと統合するために、コーディングをカスタマイズする必要があることが課題となります。手作業で互換性のあるコードを記述することは困難であり、運用が遅れたり阻害されたりする可能性があるため、オープンソースのデータプラットフォームから構築するために使用するインターフェイスツールを選択することが重要になります。

理想的なデータベース統合ツールは、カスタムコーディングを簡素化することで、ITチームの作業時間を大幅に節約します。ハンドコーディングしたパッチによる更新とセキュリティ修正でコネクターの機能を維持する代わりに、強力かつシンプルなGUIツールが、ハンドコーディングされたジョブに比べて最大10倍のスピードと最大80%のコスト削減により、データ統合タスクを処理できます。

適切な統合アプローチには無償のオープンソースライセンスオプションを利用できる柔軟性があるので、開発者はApache Hadoop、NoSQLデータベースなどのビッグデータツールの強力な機能を探索してテストできます。

データベース統合を管理するための専門知識やインフラストラクチャーを社内に持たない組織にとっては、包括的パートナーシップソリューションも選択肢になります。たとえば、ビッグデータフローのすべての側面を管理し、環境をインタラクティブなビジネスインテリジェンスマシンに変える、トップランクのiPaaS(integration Platform-as-a-Service)オプションなどを利用できます。

データベース統合を強化しましょう

まず、組織の既存のデータベースを評価し、統合ニーズに最適なプラットフォームを決定します。オンプレミスのソリューションにこだわる必要があるか、またはクラウドに移行する準備ができているか、検討してください。

データベース統合の取り組みを改善する場合も、新しい取り組みを開始する場合も、Talend Cloudの無償試用版をご利用ください。ETL、ELT、その他のデータ統合タスクを包括的に、そして視覚的に制御できます。

| 最終更新日時: January 28th, 2019