技術要素 - 9.データベース - 5.データベース応用 - 3.データ資源の管理

Last Update : April 14 2021 15:20:24

     

a. データ資源の管理

IRDS ( Information Resouce Directory System :情報資源辞書システム)
情報資源辞書システム(Information Resource Dictionary System:IRDS)とは、データ辞書を発展させたもので、情報資源全体を管理する。
従来の機能を中心とした開発手法でシステム開発を行うと、管理限界を超える量のソフトウェアが作られ、データの重複を発生し、データ資源操作がプログラム間で重複し、プログラム相互の依存関係をを強くしていた。
情報システム全体の信頼性・安全性・自由度を向上させるには、システム全体の情報資源を抽出し、共有資源として一元管理する情報資源管理の仕組みが必要となる。

 IRDSは媒体によって、次のIRMとDRMに区別することがある。

  • 情報資源管理(Information Resource Management:IRM)
    紙などコンピュータ化されないものまでも共有資源とみなして管理の対象とするもの。
  • データ資源管理(Data Resource Management:DRM)
    コンピュータ化されたデータのみを共有情報とみなした管理を行うもの。

この情報資源管理を効率的に実現するためには、重要データについては深く分析し、共通のデータベースに保存し、ツールできちんと管理し、専用のインタフェース経由でアクセスすることが必要である。

リポジトリ
リポジトリ(repository)とは、プロセスに関する情報や企業活動などに関する情報を登録・維持する辞書システムのことである。システム開発する際に、関連するメタデータを格納しておくデータベース管理システムである。システムを構成するデータの所在、ファイルの仕様、プログラム間の関連など、ソフトウェアの開発および保守における様々な情報を一元的に管理できる。
体系的に情報を保管することで保守の効率化も図れる。
排他制御の仕組み。開発者はリポジトリデータベースのサーバーから役割と権限に応じて資産をチェックアウト(ダウンロード)して編集を行い、編集後の資産はリポジトリにチェックイン(アップロード)する。
チェックアウト中の資産は、リポジトリのサーバープロセスにより排他制御されるため、誤った同時更新を防止する。

メタデータ
メタデータ(meta-data)とは、アプリケーション開発に関するデータの性格を表現する次のようなデータによりスキーマ(データベース構造)に記述されたデータである。

  • 定義情報
  • 設計情報
  • プログラム
  • テスト結果

など、一言でいえば、データの定義のデータの意味でメタデータと呼ばれる。具体的に社員名簿でいえば、社員番号・社員氏名・性別などを指す。
桁数・整数/実数・符号などで、各工程間で共用・フィードバックするため、IRDSやCASEツールにより見ることができる。

例:DBMSのメタデータは、データ定義情報としてスキーマに記述されたデータである。DBMSによってデータの定義方法が異なるため、メタデータの管理情報はDBMSに依存する。

データディクショナリ/登録簿(Data Dictionary / Directory : DD/D)
データベースに関するユーザー情報やアクセス方法、登録するデータの定義などを格納する辞書。
属性・名称・相互の関係・物理表現の記述などの情報が登録され、この辞書に基づきデータが管理される。

構造化データ 】(Structured Data)
構造化データはあらかじめデータを管理する構造を決めて、その構造に合わせてデータを格納していく「Schema-on-Write」の方式です。
二次元の表形式(Excel形式)になっているか、データの一部を見た だけで二次元の表形式への変換可能性、変換方法が分かるデータ。

非構造化データ 】(Unstructured Data
非構造化データは、形式や内容には決まりがなく、インターネットなどを利用して集められるあらゆるデータを含みます。
データ内に規則性に関する区切りがなく、データ(の一部)を見ただ けで、二次元の表形式に変換できないことが分かるデータ。

半構造化データ 】(Structured Data)
非構造化データに「フレキシブルな構造」を与えたものと定義されます。
データ内に規則性に関する区切りはあるものの、データの一部を見ただ けでは、二次元の表形式(Excel形式)への変換可能性、変換方 法が分からないデータ。

ストリームデータ
ストリームデータとは、無限に到来する時刻順のデータのこと
ストリームデータの特性として、以下の3つがあります。

  1. 急速にデータが生成され、絶えず流れている。
  2. データが無制限に発生し続けている。
  3. 時間の経過によりデータ性質・傾向・価値が変動している。
ストリームデータとは無限に増え続けるデータであり、昨今注目されているビッグデータがまさにそれと言っていいでしょう。


     

www.it-shikaku.jp