『データプレパレーションに関するガートナーマーケットガイド2019』の3つの重要点

『データプレパレーションに関するガートナーマーケットガイド2019』の3つの重要点

  • Jean-Michel Franco
    Jean-Michel Franco is Director of Product Marketing for Talend. He has dedicated his career to developing and broadening the adoption of innovative technologies in companies. Prior to joining Talend, he started out at EDS (now HP) by creating and developing a business intelligence (BI) practice, joined SAP EMEA as Director of Marketing Solutions in France and North Africa, and then lately Business & Decision as Innovation Director. He authored 4 books and regularly publishes articles, presents at events and tradeshows and can be followed on Twitter: @jmichel_franco


Jean-Michel Franco          2019年4月26日

ガートナーは、データプレパレーションに関するマーケットガイド2019([1])(2019 Market Guide for Data Preparation)を公表しました。マーケット黎明期の2015年、データプレパレーションが主にセルフサービスのユースケースを支援することを想定していた時代に初めて作られたガイドで、今回が第4版となります。

マジック・クアドラントと比較すると、この マーケットガイドシリーズは主に初期、成熟、または小規模なマーケットを取り上げており、ベンダー間の競争の位置づけに関する情報は少ないですが、マーケットの状況や長期的に見た市場の発展についての情報は充実しています。このような資料では、多くの人がまずベンダーのプロフィールをチェックされるかと思います(Talend Data Preparation も詳細なプロフィールと一緒に紹介されています)。このレポートが提供するリーダーシップについての思考と市場分析にもぜひ注目していただけると幸いです。

組織内でのデータプレパレーションの価値と拡張を成功させる方法について、著者のEhtisham ZaidiとSharat Menonのコメントも参考にしてください。

このレポートを調べた後に、私はデータプレパレーションという刺激的なマーケットでのお客様のニーズに対応する3つの重要な点をお伝えしたいと考えました。

 

データプレパレーションは、データ管理をチームスポーツへ

データプレパレーションの市場が誕生したきっかけは、セルフサービス機能がトレンドになったことでした。これは、TableauやPower BIといった最新のデータディスカバリーツールを使用して権限が与えられていても、ビジネスユーザーが知見を得る前に新しいデータソースを効率よく見つける方法がなかったことから発生しました。ビジネスユーザーはIT部門に頼るか、ガバナンスの十分ではない方法でMicrosoft Excelなどのツールを使用してデータをサイロ化するしかありませんでした。データプレパレーションツールはこうした生産性の面での課題に対応するものでした。

レポートによると、データ専門家やビジネスアナリストは、データから実際に知見を引き出せるようにするために、データの検索や保護の準備に業務時間の80%を費やしています。データプレパレーションは、より多くの関係者がデータ統合やデータ品質管理を利用できるようにすることによって、このような状況を改善するために登場したのです。これは21世紀初頭では大きな課題でしたが、それ以降、データ関連業務はより規模の大きなゲームになっていきました。個人の生産性の問題ではなくなり、データ駆動型の知見の活用に向けた企業文化の育成も重要になってきています。

ガートナーのマーケットガイドは、このような動向に焦点をあて強調したことにあります。手法やツールが完成しつつある現在、データプレパレーションを社内とIT部門の誰もが連携してデータを活用できるチームスポーツにすることが主な課題になっています。結果として、もっとも重要なことは運用です。

ビジネスユーザー、ビジネスアナリスト、データサイエンティストやデータエンジニアが別々にその場しのぎで行っていることを集約し、生産時に十分にガバナンスされた方法で繰り返し実行できる、社内全体で活用できる資産にする必要があります。

最終的にこのアプローチは、データ統合、データ分析やビジネスインテリジェンス、データサイエンス、データウェアハウス構築、データ品質管理といった会社全体での取り組みに役立ちます。

 

スマートな人にはスマートなツールを…逆もまたしかり

ガートナーのマーケットレポートでは、データカタロギング、パターン認識、スキーマオンリード、機械学習といった最新鋭のテクノロジーがツールに組み込まれていることも強調しています。

これによってスキルの低いユーザーでもデータを使って複雑な活動ができるようになり、一方でデータ変換、統合、照合や復旧は、それらが繰り返し作業になった時点で自動化できるようになりました。

さらに興味深いのは、ガートナーがこうしたテクノロジーのイノベーションを市場の収束に結び付けているということです。レポートでは次のような予測が書かれています。

「2024年までには、機械学習によって強化されたデータプレパレーション、データカタログ、データ統一化およびデータ品質管理ツールは、統合された最新のエンタープライズ情報管理プラットフォームにまとめられるだろう」。

実際、データプレパレーションを特定のビジネスユーザーを対象にした単独の規律であると考えるのは思い違いといえるでしょう。むしろ、潜在的にはあらゆる人が作業に関与できるようにする機能が整っていることから、情報管理における革新的テクノロジーとみなすべきです。革新的なテクノロジーを活用し、企業は新しい共同作業を通じてデータバリューチェーンを組織することができます。

Talendでは「コラボレーション型データ管理」と呼び、このマーケットガイドでのガートナーを含む一部のアナリストはDataOpsとして言及している手法です。

データ品質管理を例にとってみましょう。

多くの企業では、データ品質の対応に苦労しています。中央IT部門やCDOオフィスといった中央組織の少人数しかいないデータ品質管理の専門家に頼りすぎるアプローチをとっているためです。こうした専門家は、データ品質プロファイリングの調整や復旧では重要な役割を果たしますが、社内で最もデータを熟知しているというわけではありません。データの取得源に近いところで働いている同僚に、データクリーニング作業の一部を依頼する必要があります。こうした人々が手軽なデータプレパレーションツールを使えると、データ品質管理の効率は非常に高くなります。

 

ハイブリッドクラウドの価値

ガートナーはまた、革新的なPaaS(Platform as a Service)デプロイメントモデルを通じて提供されるデータプレパレーションに対する顧客の需要の高まりを把握しています。ガートナーが強調するのは、基本的なSaaSを超えるはるかに洗練されたデプロイメントモデルが必要であるということです。

レポートでは「企業が必要としているのは、事前にデータを移動させなくても、もっとも意義のある場所でデータプレパレーションを行うことができるような柔軟性が必要である」と説明しています。

技術面(データがある場所で実行できるほどデータプレパレーションを普及させるなど)、さらにビジネス面(データプライバシーのコンプライアンスのために、国境を越えたデータ移動を制限するなど)の両方の制約に合わせたハイブリッドモデルを企業は必要としているのです。

これは非常に強調したい優れた点で、Talendでは具体的に見ています:ハイブリッドなデプロイメントに関しては、当社のData Preparationツールには高度な要件が求められています。

当社のクラウドのお客様の中にも、データプレパレーションをオンプレミスで実行することを希望されています。また、クラウドのデプロイメントを希望しているが、Talendのリモートエンジンを通じて社内のファイアウォール内のデータにリモートでアクセスする機能を求めるお客様もいます。

さらに、データプレパレーションを運用可能にしたいお客様は、ビッグデータクラスターの中でネイティブに実行できます。

 

データプレパレーションの準備はできていますか。試してみませんか。

Talendは多くの人々が連携してデータを取り扱うことを可能にすることに過去3年間力を注いできました。ビジネスアナリストや、さまざまな事業部門の社員のニーズに応えるべく、Talend Data Preparationを2016年に発表しました。翌年には、Data Preparationの右腕であり、データ証明と復旧を行うTalend Data Stewardshipもリリースしました。いずれのアプリケーションも、2017年にはTalend Cloudに組み込まれました。2018年秋には、新しいアプリケーションであるTalend Data Catalogをリリースしました。コラボレーション型のデータガバナンス、データキュレーション、有意義なデータへの検索ベースのアクセスを促進します。そして現在Pipeline Designerを提供し始めました。

データを連携したい中央組織や事業部門からの役割が増えつつある今、こうした新しいデータのヒーロー達に、統合化プラットフォームでアプリケーションセット全体を活用していただきたいと考えています。

これらのアプリケーションは、アナリストからエンジニア、開発者からビジネスユーザー、さらにアーキテクトからスチュワードまでに、統制された方法で、それぞれの役割のニーズに対応するよう設計されています。

2019年は、Data PreparationとData Stewardshipにとって刺激的な年です。

春のリリースではいくつかの重要でスマートな機能を追加しました。例えば、機械学習を使用して名称の一部分をそれぞれのサブパーツとして抽出したり、セマンティックタイプの定義に基づいてフィールドの一部分をサブタイプとして抽出したりすることができます。

また、データマスキング機能も改良しました。GDPRやCCPAを始めとする規制によって高度なプライバシー管理が求められる中、非常に需要が高まっている機能です。

今年予定されている、機械学習を活用したさらなるイノベーション、ハイブリッドデプロイメントと運用に関するオプションの提供、または広範囲のデータプロフェッショナルとビジネスユーザーが、信頼性の高いデータを、管理された方法で連携して扱うことを可能にする機能の強化などにご期待ください。

 

データプレパレーションはホットなテーマです。詳しく知りたいですか?

アプリが実際に動いているところをご覧ください。または試用も可能です。

ディスカッションに参加

0 Comments

コメントを残す

Your email address will not be published. Required fields are marked *