クラウドではじめるデータマネジメント
活用データの収集と外部連携におけるデータマネジメント組織の役割
活用データの収集と外部連携におけるデータマネジメント組織の役割
本コンテンツは、当社で執筆している日経クロステック記事「実践DX、クラウドで始めるデータマネジメント 第7回「新たなデータも対象に、データマネジメント組織が収集にまで関わる意義」の内容を一部要約しつつ独自コンテンツを加えたものです。日経クロステック記事の全文はこちらをご覧ください。
目次
この記事は、活用対象となる「データの収集」に関する基礎情報や現状に加え、外部データ活用の広がりとデータマネジメント組織の役割について例を含めて説明します。視野を外部データにまで広げてデータマネジメントに取り組む必要性をご理解いただけます。
顧客に関する情報をあらゆる角度から収集。
ビッグデータが新たな価値を生む
デジタルマーケティング手法やデジタル技術の進展に伴い、企業は自社のメディアやECサイト、スマートフォンアプリなどを通じて、これまでは収集不可能だった顧客行動の細部に至るまでのデータを新たに大量に獲得し、顧客をより深く理解できるようになりました。例えば、ビーコン技術や地理的位置情報データを取得することで、顧客がどの地域にいるのか、どの店舗を訪れているのかといった情報を把握できます。企業は地域特有の消費傾向を理解したり、ターゲットとする顧客に合わせてパーソナライズされたプロモーションやオファーを展開することが可能になります。
加えて、インタラクティブコンテンツの利用も増加しています。クイズやアンケート、インタラクティブビデオなど、ユーザー参加型のコンテンツを通じて、消費者の好み、興味、意見などを詳細に収集することができます。これらのコンテンツは、顧客エンゲージメントを高めると同時に、貴重な市場調査データとしても機能します。企業はこれらのデータを活用して、顧客に合わせた製品開発やマーケティング戦略を策定し、競争優位を高めることができるのです。
これらのデータは、これまでの企業活動において収集可能だったデータの量をはるかに超えるため、「ビッグデータ」と言われています。
また、他社が収集した外部データと自社が保有するデータを統合し、活用することで、新たなビジネスインサイトや顧客理解を深めることも可能です。たとえば、市場調査データと自社の顧客データを組み合わせることで、よりターゲットに合わせたマーケティング戦略を策定できるようになるのです。このように、外部データの統合による新しい価値の創出も、現代のビジネス環境においては非常に重要な要素となっています。
データの3つの種類 ー データの所有者と収集方法によって分類
データの所有者と収集する方法によって、データは大きく以下の3種類に分けられます。
1)自社が直接収集するファーストパーティーデータ
2)ビジネスパートナーから提供されるセカンドパーティーデータ
3)外部の第三者から購入または入手するサードパーティーデータ
後者のセカンドパーティーデータと、サードパーティーデータが「外部データ」です。
データマネジメント組織が「データ収集」に関与すべき3つの意義
「データの収集」については、以下の3点から、事業部門だけでなく、データマネジメント組織も関わるようにします。
データの再利用性
企業内で共通して使えるデータ、例えば、住所や企業情報などは各部門が個別に収集するより、データマネジメント組織が一元的に再利用できる形で収集し、管理することで効率を高めることができます。また、外部データの重複収集も回避でき、リソースを節約できます。
データ活用の促進
データを活用する事業部門が、収集可能なデータセットの情報や収集方法を必ずしも知っているとは限りません。データマネジメント組織内にデータ活用をサポートする「データコンシェルジュ」を置いて、ビジネス変革に役立つ外部データを探索したり、事業部門に対して活用の助言をすることも有効です。
外部とのデータ共有
外部とのデータ共有は、今後ますます広がっていくことが考えられます。社外とデータ共有する際に、データに対するガバナンスやセキュリティを管理、統制することもデータマネジメント組織の大事な役割の1つです。
先進的な例では、欧州のGAIA-Xや自動車業界のCatena-Xが挙げられます。企業間でデータを共有・連係するための枠組みがつくられており、協調領域と競争領域に分かれています。協調領域については企業間でデータ共有し、産業に関わる企業全体の品質と生産性を高めることを目的としています。
日本でも、データに関する主権を保ちながら、安全にデータを流通させる枠組みについて、中央省庁や民間企業で検討や研究が進んでいます。本記事の執筆時点ではまだ実装段階に達しているものは少ないものの、企業間や業界内で共有されているデータの収集、自社のデータ共有に対応する業務などが今後発生する可能性が高いといえます。
データマネジメント業務を体系化した「DMBOK2」では、データ収集の連係が「データ統合と相互運用性」の領域に位置づけられています。実務において、組織を代表して外部とのデータ共有をする業務にデータマネジメント組織が関わる頻度が徐々に高くなっていくと考えています。
データ収集時の技術的な課題とは?
ファーストパーティーデータを例に、技術的課題について説明します。
スマートフォンアプリやウェブブラウザーからのログデータは、よりきめ細かく高い頻度で収集して活用する傾向があります。例えば、購買を躊躇しているユーザーを検知し、そのユーザーのウェブ行動履歴を元に、対話型ポップアップを表示して離脱を防止するなど、マーケティング戦略に活用することが可能です。
スマートフォン、センサー、IoT機器などから送られてくる、1つ1つは小さいものの、その頻度が高く、大量に発生するという性質のデータを「ストリーミングデータ」と呼びます。(次の中見出し2-3本文と、この文章が重複しているため、合体して加工)利用することで新たな価値を生み出せる可能性がありますが、その効果は試用してみないと分からないため、コストを抑えた収集が求められます。
ストリーミングデータの取り扱いは、アプリケーション開発とデータマネジメントの両方に関わります。収集時にデータの損失、データベース性能の低下、コストの増加などの問題が生じやすいという特徴があります。一般的に業務システムで利用されるリレーショナルデータベースは高頻度のデータ書き込みに強くないため、異なる特性を持つ基盤が必要になることがあります。問題が発生する前に、アーキテクチャや処理方法を検討することが重要です。クラウドでは、ストリーミングデータの効率的な収集から蓄積までを低コストで実現するための設計パターンが提供されています。
ストリーミングデータに最適なデータ基盤
前述のとおり、ストリーミングデータは処理漏れによる欠損や取得の遅延が起きやすく、通常の業務システムで使われるものとは異なるサービスを検討します。
AWS の「Amazon Kinesis Data Streams (Kinesis)」、「AWS Lambda」、Azure の「Azure Event Hubs」、「Azure Functions」、オープンソースソフトウェアの「Apache Kafka(Kafka)」、その商用サービスの「Confluent Cloud」などです。
これらのクラウドで大量、且つ、高頻度なデータ収集に利用できるデータ基盤のサービスや構成については、日経クロステック記事に記載していますので、ご興味がありましたらご覧ください。
多様な用途に活用可能。外部データの収集と連携
セカンドパーティーデータやサードパーティーデータの利用においては、外部のデータソースとの連携が重要です。これらのデータはデータ提供者・連携先が定めた規格や方式に従って取得するため、多様な連携方式への対応が必要になる場合もあります。
利用可能な外部データの例として、「政府の統計データ e-Stat」があります。これらはウェブサイトからダウンロード可能で、API経由でのデータ取得も可能です。また、一部のBIツールではデータの取り込みを容易にするコネクターが提供されています。
公共性の高いデータ、例えば、住所情報などの標準化も進んでいます。日本では「アドレス・ベース・レジストリ」として住所データの標準化が進行しています。標準化されたデータセットは、企業内でのデータ管理でも役立ちます。
企業間取引が主な企業では、法人番号などの企業情報の収集や名寄せに有用な外部データを利用することで、企業を一意に識別し、マスターデータとして活用が可能です。また、民間の企業情報サービスも、企業データや属性情報の取得に有用です。
消費者との取引(B to C)においては、SNSやEC事業者から提供される商品情報など、外部データは多岐にわたります。これらについては、今後の記事で紹介します。
主な外部データの例
カテゴリ | 外部データ | 内容 |
---|---|---|
政府提供データ | e-Stat | 経済統計、国勢調査などの公的調査で取得、集計された統計データ。最小単位のデータセット数が150万以上。対応形式と方法はデータセットによって異なる |
アドレス・ベース・レジストリ | 住所を標準フォーマットで定義したもの。CSV/XMLで提供。ダウンロードしてマスタデータにできる | |
法人番号 | 国税庁が法人番号公表サイトで公開されている法人番号データセット。法人番号・法人情報をCSV/XMLでダウンロードしてマスタデータにできる | |
企業情報 | uSonar | 企業情報提供の老舗。網羅性の高いデータを購入、利用できる |
帝国データバンク | 企業情報、信用情報などをAPIで取り込むことができる | |
FORCAS | 名寄せを自動で実行できるSaaS。企業が持つ関心といった属性データも保有しており分析に利用できる。提供元のユーザーベース社では経済統計を提供するサービスであるSPEEDAも提供 | |
消費者データ | モバイル空間統計(NTTドコモ) KDDI Location Analyzer(KDDI) 全国うごき統計(ソフトバンク) | 携帯電話への接続情報を基にして、個人を識別できないよう秘匿化したうえで地域別人口の統計データを提供する。商圏分析などに利用できる |
ヤフー・データソリューション | 検索データの集計結果をもとにしたデータサービスの総称。APIでデータ取得できる。一部BIツールからコネクタで直接連携して利用可能 |
次回のテーマは「データ連携」です。データ活用のプロジェクトで求められる「アジリティ」をどう実現するかについて説明します。