/home/by-natures/dev*

データ界隈で働くエンジニアとしての技術的なメモと、たまに普通の日記。

2023/02/06 読んだ記事まとめ(データマネジメントのロール, 2023年のCDO動向)

データマネジメント関連の動向に関するブログ記事を2つ読みました。2つめの記事は精読した上で ChatGPT に日本語要約させたのですが、手直しは必要なものの一から和訳するよりは遥かに早くて助かります。

Data Governance Organization and Titles

www.ewsolutions.com

Enterprise Warehousing Solutions, Inc. (EWS社) の Marco 氏によるデータマネジメントに関連した職種・ロールの解説記事です。EWS社はデータマネジメントや高度なデータ分析についての技術提供や教育を行っている企業のようで、企業ブログも上記記事をはじめ、データマネジメントに関するさまざまなトピックが紹介されています。

データスチュワードはもちろんのこと、データガバナンスプラクティスマネージャー・データガバナンススペシャリスト・データオーナー・データマネージャーなどのロールが紹介されています。領域ごとにデータスチュワードがいて、それを取りまとめるデータガバナンス委員会や横断でのデータスチュワード委員会などがあって企業全体でのデータガバナンスを規定・実行するという流れを紹介しており、どの企業もこういった役割が必要だと説いています。

一方で多くの企業ではロールを誤って定義していることもあるようです。私も「データガバナンスプラクティスマネージャー」「データガバナンススペシャリスト」というロールは初めて聞きましたし、「データマネージャー」はIT部門においてデータマネジメントにおける技術選定などをアドバイスする役割のようで、「データマネージャー」という言葉からはあまり想像できない役割が解説されていました。

企業ではロールという形で業務に名前をつけることで、適切にその人の業務の評価ができます。煩雑なデータ管理業務も「データスチュワード」という名前をつけ、データガバナンスを各領域において実行するビジネスメンバーという重要な位置付けにすることで、データガバナンスを推進することが可能です。

My 2023 Predictions for Chief Data Officers

www.snowflake.com

Snowflake 社の Chief Information Officer, Sunny Bedi 氏の投稿で、Chief Data Officer, CDO に向けた2023年のデータ活用動向予測です。

「データサイエンスのインフラはプラットフォームベースになる」や「ビジネスインテリジェンス(BI)の人々はデータサイエンティストに昇格する」は、Snowflake内にML系のサービスやStreamlitを利用したダッシュボード構築ができるようになることなどを見据えているように感じました。今まではデータをダウンロードして手元の Jupyter Notebook などで分析したり、手元の Python プログラムでモデル構築していたのが、プラットフォーム上で行えるようになるなど、ツールやデータが一元化されていく流れを説明しています。

特にノートブックベースであれば自分の好きなライブラリを利用しながらプラットフォーム上にソースコードやモデル管理を集約させることができるでしょうし、インフラやCI/CD部分の管理コストが下がってデータサイエンティスト的には助かりそうです。Databricks の方がこの辺りは一歩進んでいた印象ですが、Snowflake も同等の機能を新UIの Snowsight にどんどん追加していくでしょう。

以下、ごく簡単に要約したものを紹介します。

CDOの役割がより理解されるようになる

2023年にはCレベルのエグゼクティブや事業マネージャーが CDO 役割の真のインパクトと組織にもたらす影響を理解するようになる。CDOは、数年前には不可能だったデータ活用方法が現在では可能になったことを示す必要がある。

データのサイロ化が急速になくなっていく

データのサイロ化が解消され、データが集約管理される。これまでに得られなかった知見を提供することができるようになった。

データのマネタイズ機会が増える

データのマネタイズはほとんどの組織にとって優先順位は高くなかった。しかし、データ共有の技術が出て来たおかげで、データ自体のマネタイズが可能になってきている。

データサイエンスのインフラはプラットフォームベースになる

データサイエンティストが利用するツールはデータプラットフォームから分離して利用されることが多かったが、これからはクラウドデータプラトフォーム上に構築され、データを移動することなく利用できる。データ品質・ガバナンス能力も向上し、分散するツールの管理からも解放される。

ビジネスインテリジェンス(BI)の人々はデータサイエンティストに昇格する

上で述べた分析ツールの統合化の手助けもあり、ビジネスユーザの要望に答えるために、BIプロフェッショナルは単にダッシュボード上でデータを視覚化するだけから、 Python などの言語を利用してデータアプリケーションを構築することになる。

組織のすべての部門にデータサイエンスが浸透するようになる

過去のBIデータだけでは競争することが難しいため、データサイエンス、機械学習、巨大なデータを効率的に処理する能力による予測分析が求められる。そのため販売・マーケティングから経理部門まで、各部門が自身のデータサイエンスチームを配備し、将来を決定するようになる。

簡単に構築できるデータ駆動アプリがSaaSの面貌を変える

多数のSaaSソリューションがあり多くの業務を自動化できるが、一般的な SaaS ソリューションは特定の需要には対応できずカスタマイズが必要である。クラウドデータプラットフォームと簡単な開発環境があれば、組織は特定の需要に応えるソリューションを簡単に構築できる。

消費ベースのビジネスモデルが新しいスタンダードとなる

組織は SaaS の使用量と将来の費用を予測することができ、使っていない SaaS サブスクリプションに対して過剰な請求を避けることができる。