技術要素 - 8.マルチメディア - 1.マルチメディア技術 - 5.情報の圧縮・伸張

Last Update : January 02 2021 16:00:24

     

a. 情報の圧縮・伸張

可逆圧縮
可逆圧縮とは、圧縮前のデータと、圧縮・展開の処理を経たデータが完全に等しくなるデータ圧縮方法のこと。ロスレス圧縮とも呼ばれる。
アルゴリズムとしてはランレングス、ハフマン符号、LZWなどが有名。

  • ランレングス(連長圧縮)・・・ある連続したデータを、そのデータ一つ分と連続した長さで表現することで圧縮している。 例えば、「A A A A A B B B B B B B B B A A A」は「A 5 B 9 A 3」と表せる。これは、Aが5回続き、そのあとにBが9回、そしてAが3回続いていることを表している(連続回数を、元のデータを表す符号の前に記録することもある。その場合、符号化した後は「5 A 9 B 3 A」と表される)。
    さらに、データがこの2種類(AとB)だけで、最初にAが来ることにしておけば、「5 9 3」だけで表せる。このルールに従ったときにBが最初に見つかった場合は、最初にAが0回連続していることにすれば良い。例えば、「B B B A A A A A B B B B B A A A」は「0 3 5 5 3」で表せることになる。
    こういったことから、白と黒以外にほとんど情報がないモノクロファクシミリでよく使われている。
    このように同じデータが並んだものをラン(run)といい、白が並んだものなら白ラン、黒が並んだものなら黒ランと呼ぶ。また、ランが連続している長さのことをランレングス(run length)という。このような白か黒かという値と、それが連続する長さ(ランレングス)を記録しておけば、データの量を減らすことができる。
    連長圧縮の欠点は、データが連続していないと、符号化後のデータが元のデータより膨らんでしまうという点。例えば、「A B C D A B C A B A B C D E」は「A 1 B 1 C 1 D 1 A 1 B 1 C 1 A 1 B 1 A 1 B 1 C 1 D 1 E 1」となる。この場合の圧縮率は200%、つまり元の2倍に膨らんでしまった。

  • ハフマン符号(MH符号化)・・・データの出現頻度に対する規則性を使ってデータの圧縮を行う。出現頻度の高い文字を短いビットで表す。出現頻度の少ない文字は長いビットで表す。
    そのため、JPEGやLHAなどの圧縮フォーマットで使用されている。

  • モディファイド・リード符号化(MR符号化)・・・普通の画像では画素のラインのある1行とその下の行では似たような画素順の並びとなっていることを利用する符号化である。つまり、上の行に対して次の行では、上の行と異なっている部分のデータを送ることにすればデータの量を減らすことができるということだ。MR符号化( Modified READ )は、FAXで利用される。
    垂直方向(走査線間)の相関を利用して1次元符号化の効率を高めた2次元符号化方式。MH(modified Huffman)より圧縮率が高い。

  • モディファイド・モディファイド・リード符号化(MMR符号化)・・・走査線のデータを符号化するときに、一つ前の走査線のデータとの差を検出して符号化する、2次元符号化方式のMRを一部修正した符号化方式。MMR符号( Modified Modified READ )を使っているG3 FAXでは、誤り訂正符号を使ってビット誤りの影響を防いでいる。

  • LZW・・・辞書圧縮という手法を、Welch氏が改良した方式。
    辞書圧縮とは、あるデータを圧縮する際、既に読込まれたデータの中からもっとも長い一致文字列を探し、(もし発見できた場合に)その位置と一致長で置き換える方法である。
    LZWは、画像ファイルのGIF形式やTIFF形式の圧縮方式として使われているのをはじめ、モデムの圧縮プロトコルであるV.42bisや、文書ファイルのPDFPDF形式、ページ記述言語のPostScript Level 2など、様々な場面で使われている。

  • ZIP・・・フィル・カッツが考案および開発したデータ圧縮形式およびファイルフォーマットである。

コンピュータ上でよく扱われるLZH、ZIP、CABや、画像圧縮形式のPNG、GIF、動画圧縮形式のHuffyuv、音声圧縮形式のWindows Media Audio Lossless、Apple Lossless、AAL、FLAC、TAK、Dolby TrueHD、DTS-HDマスターオーディオ、Meridian Lossless Packing などが可逆圧縮である。

非可逆圧縮
非可逆圧縮とは、圧縮前のデータと、圧縮・展開を経たデータとが完全には一致しないデータ圧縮方法のこと。不可逆圧縮とも呼ばれる。画像や音声、映像データに対して用いられる。
静止画像ではJPEG、
動画像ではMPEG-2、MPEG-4 AVC/H.264、DivX、On2VPx、
音声ではVorbis、WMA、AAC、MP3、ATRAC、Dolby Digital、DTS Digital Surround、Dolby Digital Plus、DTS-HD High Resolutionなどが代表的な非可逆圧縮方法にあたる。
圧縮に伴い、データは欠落・改変するものの、人間の視聴覚特性を利用して劣化を目立たなくしている。つまり、人間の感覚に伝わりにくい部分は情報を大幅に減らし、伝わりやすい部分の情報を多く残すように行う。その結果、すべてのデータを均一に扱う可逆圧縮と比較して圧倒的な圧縮率が得られ、利点である。また、圧縮率と品質の劣化を両天秤にかけることができ、目的や環境の制約に応じて適切なバランスを選ぶことができる。たとえば、低速な通信回線で音楽などを送信する場合や美術的な再現性を必要としない画像の表示・印刷の場合には圧縮率を高めてデータを小さくする。逆に高速な通信回線が使える場合や、より鮮明な画像の表現を求める場合は圧縮率を低くして大きなデータをやり取りする。

書庫ファイル
複数のファイルを一つのファイルにまとめて、格納(アーカイブ)したファイルのこと。


  [ 例題 ] 
  1. 平成21年度春期 問04  圧縮方式
  2. 平成20年度春期 問30  アーカイブ
  3. 平成19年度春期 問70  圧縮方式
  4. 平成16年度秋期 問35  アーカイブ
  5. 平成10年度秋期 問32  不可逆圧縮


     

www.it-shikaku.jp