情報化社会において、「データ」はとても重要です。データを分析することで、仕事を快適に効率的に行えるようにしたり、今後の状況を予測して適切な商品を生産したりといったことができます。こうした「データ」はどのように保管されていると、ビジネスで使いやすいでしょうか。 これまでにさまざまな方法、技術が生まれてきましたが、最近では「データファブリック」という考え方が注目されています。データの織物(Fabric)と呼ばれるデータ活用の概念について、考えてみたいと思います。
キャリアマップ編集部 文/ITジャーナリスト・ライター 岩元直久
キャリアマップ編集部 文/ITジャーナリスト・ライター 岩元直久
データはどこにあると使いやすい?
「データ」と聞くと、学生の皆さんはどのようなものを思い浮かべるでしょうか。Instagramに投稿した友だちとの映える写真、ダンス動画、Twitterのツイートやダイレクトメッセージなど自分が関わったものはもちろん、お気に入りの音楽や漫画、アニメなどのコンテンツも大切なデータです。皆さんの世界では、多くのデータはスマートフォンを入り口にしてスマートフォンの内部のメモリーや、ネットワークを介したクラウドサービスに保存されているケースが大半でしょう。
使いたいときに使いたいデータをすぐに取り出せることが重要なことは、皆さんが生活の中で実感しているはず。それは、社会に出てからの仕事 をするうえでも同じです。使いたいときに使いたいデータを適した形で取り出せることは、効率的な仕事の進め方や新しい仕事のアイデアを生み出すために重要です。このようにデータのスムーズな活用を考えたときに、最近ビジネスの世界で注目されている概念が「データファブリック」 です。
データファブリックのファブリックとは、布や織物のことを指します。縦糸と横糸が織り込まれて、柔軟に形を変えられる布や織物のように、データを縦横無尽に、そして自在に活用できるようなデータ活用環境と考えると良いでしょう。データファブリックという概念は2014年にストレージサービスなどを提供する米NetAppが提唱したと言われています。その後、ITアドバイザリー企業のガートナーが「2022年の戦略的テクノロジーのトップ・トレンド」(2021年)の1つとしてデータファブリックを取り上げたこともあり、一段と注目されるようになってきています。
ここからは、ビジネスにおけるデータ活用の広がりから順を追って、データファブリックの登場までを見ていきましょう。
ビジネスで活用が進むデータ
皆さんにとって、ビジネスの話はまだ遠い将来のことかもしれませんね。でも、エンジニア、特にIT分野で仕事をしていく可能性がある皆さんにとっては、データの活用は必要不可欠なものになるはずです。ここではまず、データファブリックの話題に触れるにあたって、ビジネスとデータの関係性を振り返ってみます。
現代ではデータに基づく判断を活用する「データドリブン経営」の考え方が広まっています。しかし少し前のビジネスの現場は、「経験」や「勘」、そして「度胸」などの人間的なものに支えられていました。極端な例としては「今日の髪の具合だと湿度が高いから、水を少なめに調合して蕎麦を打とう」といったものです。ところが情報化が進むに従って、さまざまなデータを分析することで勘や経験よりも安定した判断ができることがわかってきました。「気温が22度を超えるとアイスクリームが売れるが、30度を超えるとアイスクリームよりもかき氷が売れる」といったデータ分析の話を聞いたことがあるかもしれません。このように、勘や経験だけでなく、データを基にすることで的確なビジネス上の判断ができるようになるのです。
最近ではAI(人工知能)が発達して、データ分析から経営的なものを含めたビジネスにおける判断がしやすくなってきました。消費者の購買情報の大量のデータと気候や地域情報、イベント開催情報などをAIに分析させることで、どの地域でどのような商品が売れそうかを事前に予測して、的確な発注をかけるといったことも可能になっています。工場では多くの機器の状態をデータで把握することで、不良品の発生を抑えたり、故障を未然に防いだりといった取り組みを進めています。そう、データドリブン経営を実現するには、適切なデータにきちんとアクセスできることや、複数のデータに自在にアクセスできることが欠かせないのです。
ビジネスデータの格納方法も進化
一方で、データの格納の仕方もさまざまな手法が考えられてきました。昔の企業の情報システムでは、経理や顧客管理、生産管理などにそれぞれのシステムが分かれて存在しており、その中で適切にデータが扱えれば良かったのです。ところが、企業内のあらゆるデータを単体でなく、紐づけして分析して経営判断に使うようになると、システムのハードルを超えたデータを使いたくなります。そこで業務に関する情報をまとめて保管する情報の倉庫として、「データウェアハウス」が生まれました。企業内にある情報のうち、経営戦略を決めるために必要な情報を整理して、時系列で管理します。データウェアハウスのデータを分析すれば、経営判断が容易にできるようになったのです。
ところが、話は簡単には終わりません。AIがデータ活用に使われるようになると、今まで必要だと思われなかった情報も、分析対象として求められる可能性が出てきました。人間が考えなかったような組み合わせのデータから、AIは特別な関係を見つけることがあるからです。すると、デー タウェアハウスのように事前に整理されたデータを取り扱うだけでは分析対象が不足するようになります。そこで経営判断で必要なシステムや機器などが取り扱う生のデータをそのまま保管する場所が求められるようになりました。問い合わせやクレームの電話の音声、手書きの注文書などもこうした生のデータに含まれます。いつか分析に役立つかもしれないデータを貯めておく貯水池のようなもので、「データレイク」と呼ばれます。
こうして生まれたデータレイクを、さらに発展させた概念がデータファブリックです。ビジネスに必要なデータは、1カ所にまとまっているわけではありません。企業の情報システム部門にあるサーバーなどの機器、支店などのサーバー、企業が契約しているデータセンター、そしてGoogle やAmazon、マイクロソフトのようなクラウドベンダーが提供するストレージなど、あちこちに分散しているのです。こうした多数のハードウェアやサービスにまたがるデータを、あたかも1つのストレージから読み出すように統一して利用できる環境がデータファブリックです。
データファブリック実現のための技術には、データ仮想化が重要な位置を占めています。必要なデータにアクセスしたい人に対して、異なるハードウェアやサービスを橋渡しし、仮想的にデータを統合して利用できるようにする技術です。織物のように、多様なデータが織りなした形で自分の手元にやってくる姿が見えてきませんか。
データを活用しやすくする環境を今から考える
ここで、ぜひ覚えてもらいたいのは、データウェアハウスやデータレイク、データファブリックという個別の言葉や仕組みではありません。皆さんはビジネスパーソンやエンジニアとしてデータを活用していく可能性は多いですよね。そうしたときに、データがどこにあるか、どう使えるかを考えてみてほしいのです。
スマホを使いこなしている皆さんでも、あるアプリから別のアプリにデータを移して使いたいと思ったときに、面倒だなと感じる作業をすることがあるでしょう。それは、今は仕方ないことかもしれません。しかし今後、ビジネスパーソンやエンジニアとしてデータを取り扱うようになった ら、データファブリックが示すようにハードウェアやサービス、アプリを超えて複数のデータを統合して取り扱う可能性にも目を向けてください。現状のデータの扱い方は、過去の人や業務に適したものであったとしても、将来にわたって正解だとは限らないのです。
このデータと、あのデータを結びつけて分析すると、どんなことが起こるだろうか。多様なデータを統合して取り扱えるデータファブリックの考え方を知ることで、これまでのデータ管理の仕方では難しかった新しい発見があるかもしれません。