2.4 データにもライフサイクルがある
モノには製造されてから消費されるまでの一連の流れがあるように、データも生成されてから廃棄されるまでの一連の流れが定義されています。
DAMA-DMBOKでは、データライフサイクルの概念を下記のように示しています。
このライフサイクル全体を把握し適切な管理を行うことで、データが無駄なく整理されいつでも利用できる状態に保つことができます。
個人的な意見として、この中でも特に重要なのが「計画」と「生成/取得」であると思います。
「計画」では、組織におけるデータ活用の目的を明確にした上で、必要なデータを集める方法や利用していく流れを考えます。
「計画」が無くては、次のステップである「設計と実装」を行う上で適切な要件定義ができません。
その先の「利用」フェーズにおいては、目的が固まっていないことからデータを前に右往左往してしまうなどの問題が生じます。
また、「生成/取得」が重要な理由は、このフェーズでは比較的大きなコストが発生することも考慮しなくてはいけないからです。
データを「生成」する場合、何らかの投資を行い、必要なデータを生み出す仕組みを作ることになります。(例:IoTの設置やシステム構築する場合など)
データを「取得」する場合も、外部のデータ供給企業やリサーチ企業からの調達コストがかかります。
或いは、組織内でデータを取得する場合にも、関係者との調整や作業コストが発生することもあるでしょう。
「生成/取得」を行う際は、目的に応じて必要なデータの領域や範囲を定めてコストを抑えながら取り組むことが大切です。
データはビジネスや組織が大きくなればなるに比例して生成されるデータが大きくなります。そして、生成されるデータの中には実際の意思決定に利用されないデータも増えていきます。
コストを考慮するとそれら全てのデータを管理することは困難なケースも生じます。
「計画」のフェーズで利用される重要なデータを捉えROTデータ(利用価値のないデータ)の生成や管理を抑えながら、ライフサイクル全体を管理していくことがデータ資産の価値向上につながります。
次の記事ではリスク管理について紹介します。