/home/by-natures/dev*

データ界隈で働くエンジニアとしての技術的なメモと、たまに普通の日記。

2021/04/23 ハーバードビジネスレビュー: 「データ管理は戦略である」を読んで

輪読会への参加 "Data Governance: The Definitive Guide"

本日からデータガバナンスに関する書籍の輪読に参加させています:

www.oreilly.com

社外の方とデータマネジメントについて議論できるのはとても貴重な機会でありがたいです。普段業務で悩んでいるようなことを皆さん話されていて、どの会社でも同じような問題を抱えているのだと知りました。

後からデータガバナンスを敷くのは難しいのではないか、といった話もありました。ただ現実的に最初からデータガバナンスがしっかりしている組織はとても珍しそうですし、じゃあどこから手をつけたら良いのか?というと、成熟度評価をしたりして地道に押し進めるしかないんでしょうね。。

昔は基盤刷新などでシステムが入れ替わるタイミングで体制を整える、といったことがあったそうですが、一度クラウド基盤を利用し始めると、滅多に BigQuery からどこかに移る、といったことはないでしょうし、データ削除も行われずにデータが蓄積されていく一方の「データスワンプ」が生まれやすくなっているのかもしれません。

2025年までに175ZBものデータが生まれるとの試算があります。Zettabyte Era(ゼタバイトの時代) なんて言葉もあるようです:

Zettabyte Era - Wikipedia

「人間よりシステムがデータのことを知っている時代」という記載もあって、そんな時代のデータをどうやって管理していくんでしょうか?うまくデータを扱いこなせないとビジネスが成り立たなくなる時代が来ているのかもしれません。

ハーバードビジネスレビュー「データ管理は戦略である」

こちらの論文を読みました:

www.amazon.co.jp

データマネジメントって地道で対費用効果が見えづらい活動なのですが、それが「戦略である」と書かれていてふと目についたんです。

短い論文であまり内容に触れるとネタバレになってしまうのですが、Single Source of Truth: SSoT に対し、Multiple Versions of Truth: MVoT という考え方を提唱していて、ある程度多様なデータの捉え方を許容するという考え方です。SSoT を重要視する組織は防御、MVoT を重要視する組織は攻撃のデータ活用ができると説明されています。

データガバナンスはデータ利用ユーザの統制を敷き、可能な限り同じマスタデータを参照してもらうのが綺麗な世界だと思っていましたが、最低限守らなければいけないデータ以外はある程度ユーザ側に委ねる世界があってもよいんだと学びを得ました。