技術要素 - 9.データベース - 5.データベース応用 - 1.データベースの応用

Last Update : May 06 2021 12:22:02

     

a. データを分析して有効活用する技術

データウェアハウス (Data Warehouse)
基幹系業務システム(オペレーショナル・システム)からトランザクション(取引)データなどを抽出・再構成して蓄積し、情報分析と意思決定を行うための大規模データベースのこと。こうしたデータベースを中核とした意思決定支援システムのこと、あるいはこのようなシステムの構築概念のことを指す場合もある。
「データウェアハウスは、意志決定(Decision)のため、目的別(Purpose-oriented)に編成され、統合(Integrate)された時系列で、削除(Delete)や更新(Update)しないデータの集合体」とされる。

ETL 】 (Extract/Transform/Load)
データウェアハウスを構築し、分析を行うためには、業務システムで発生したデータをデータベースに収納する必要がある。この作業を行うことやツールをELTという。
基幹系システムなどに蓄積されたデータを抽出(extract)し、データウェアハウスなどで利用しやすい形に加工(transform)し、対象となるデータベースに書き出す(load)こと。また、これら一連の処理を支援するソフトウェア。

データクレンジング
データベースの中から入力ミスのデータや重複データを洗い出し、そのような異質なデータを取り除いてデータベースの精度を高めること。データクリーニングともいう。
データベースの精度を高めることにより、経営やマーケティングに有用な相関関係やパターンを探り出すデータマイニングなどに役立てることができる。

データマート
データウェアハウスの中から特定の目的に合わせた部分を取り出したもの。通常は利用部門が利用目的に合ったデータのみを所持するものである。
利用部門ごとに使用するデータや分析内容が異なることが多いため、その利用部門が必要とするデータのみをデータウェアハウスから抽出したり、その利用部門が必要とする分析データをあらかじめ集計することにより、分析レスポンスを向上することができる。これは、データ容量が小さくなることやリクエストのたびに集計値を計算することがなくなるため、レスポンスが向上できることと、通常、利用部門ごとにサーバを設置するため、サーバ単位の同時ユーザ数が減るためでもある。

OLAP ( Online Analytical Processing)
日本語では「オンライン分析処理」を意味します。企業が蓄積した顧客データや販売データを多次元的に集約し可視化するシステムです。簡潔に言えば多次元集計ツールと言えましょう。データウェアハウス(データの倉庫、集まり)に蓄積された大量の元データを多次元データベースに格納し、利用者がこれを様々な角度から検索・集計して問題点や解決策を発見します。
OLAPの操作には、ダイシング・スライシング・ドリルダウンなどがある。

  • ダイシング・・・多次元データベースを立方体のようにみなし、その立方体を転がすように、分析軸を入れ替える操作
  • スライシング・・・立方体の側面をスライスするように断面をとして分析する操作
  • ドリルダウン・・・ここのデータをさらに詳細に分析すること

データマイニング (Data Mining)
種々の統計解析手法を用いてデータウェアハウスなどに蓄積された膨大なデータを企業データを分析し、隠れた関係性や意味を見つけ出す知識発見の手法の総称、またはそのプロセスのこと。

ビッグデータ
インターネットの普及とIT技術の進化によって生まれた、これまで企業が扱ってきた以上に、より大容量かつ多様なデータを扱う新たな仕組みを表すもので、その特性は量、頻度(更新速度)、多様性(データの種類)によって表される。
ビッグデータの特徴は、1つめはデータ量が多いということ、2つめはデータの種類が多い(多様性)ということ、そして3つ目はデータの変化する頻度が多いということです。そして、これらの条件が重なることで、従来のシステムでは取り扱うことが困難であったデータとそれを扱うためのシステムのことを「ビッグデータ」と呼びます。

ビッグデータの特徴には「4つのV」という要素があり、このVが含まれているものを「ビッグデータ」と呼んでいます。

  • Volume 容量
    ビッグというくらいですから、容量の巨大さが特徴のひとつです。現在の基準は数テラバイトから数ペタバイト程度のデータ量のものを指すようです。
  • Variety 種類
    構造化データ(CSVやDBに格納できるデータ)以外にもデータには種類があります。ビッグデータには音声、動画、画像、センサ情報などのありとあらゆる形式でのデータが含まれているという特徴があります。
  • Velocity 頻度・スピード
    交通系ICカードのデータ、SNSなど、リアルタイムで高速に増え続けるデータが格納されているという特徴もあります。
  • Value 価値
    分析することで経済的価値が生み出せるデータのこと。

簡単にまとめると「分析により経済的価値を生みだせる、あらゆる形式で増え続ける大量のデータ」がビッグデータです

OLTP ( Online Transaction Processing )
ネットワークに接続された複数の端末(もしくはクライアント)がそれぞれ、ホストコンピュータ(もしくはサーバ)にアクセスして処理要求を行い、それに基づいてホストコンピュータがデータの追加・更新・変更・削除といった処理を行い、その処理結果を逐次端末に送り返す形の情報処理方式。

文書管理システム
電子文書や紙の文書をデジタイズしたものを格納・管理するコンピュータ上のシステムである。

営業支援システム
ITを用いて営業部門で情報共有するためのツールです。個人毎に保有していた営業ノウハウ(顧客へのアプローチ方法、提案内容、タイミングなど)を部門内で共有することにより、部門全体の営業力のレベルアップを図ったり、商談履歴や営業活動履歴をデータとして管理することにより、漏れのない効率的な営業活動が可能となります。


  [ 例題 ] 
  1. 平成29年度春期 問29  ビッグデータ
  2. 平成22年度春期 問33  データウェアハウス
  3. 平成18年度秋期 問35  意思決定支援


     

www.it-shikaku.jp