- おすすめ
不具合未然防止の基本と実務への適用《事例で学ぶ FMEA/FTA/DRBFMの効果的な使い方》(セミナー)
2024/12/3(火)9:30~16:30
お問い合わせ
03-6206-4966
今回は、データ圧縮/伸長に関する技術を取り上げたいと思います。
「データ圧縮」という言葉をご存じの方も多いと思います。
パソコンにデータ圧縮アプリをダウンロードした経験がある人も多いかと思います。
または高効率符号化と聞いた人もおられるのではないでしょうか。
これらは同じ意味を持っており、データ圧縮は元の情報を少ないサイズで符号化することです。
例えばメールなどでファイルを送るときやディスクなどの記憶媒体にデータを記憶するなど行う時に通信量や記憶容量の低減を行うといった、媒体を効率的に使用するために必須の技術であり、あらゆるところで利用されています。
目次
「データ圧縮」とは、データをある法則(アルゴリズム)で計算して変換することで、この中で実質的に内容が損なわれることがない情報量を無くすことなくデータ量を減らす効率的な符号化です。
また、圧縮されたデータは再度使用するときに「データ伸長」(「解凍」「展開」とも呼ばれます)という元に戻す作業が必要です。
ここで、このデータの伸長時に全く元の状態に完全に復号化できるかどうかの違いを「可逆圧縮」/「非可逆圧縮」という言葉で示します。
つまり、全く完全に元の状態に戻すような圧縮を「可逆圧縮」と呼び、完全ではなく細部は戻せないものの、情報全体は意味が変わらないように圧縮することが「非可逆圧縮」です。
「可逆圧縮」は、データの冗長性を無くして、データの法則性や偏りなどを見つけ出して圧縮することで、「ロスレス圧縮」とも言われます。エクセルやワードなどの文書、プログラムファイル、数値データなどの圧縮に利用されます。
一方の「非可逆圧縮」は、データ圧縮の過程で一部のデータ欠落を許容できる圧縮であり、効率的な圧縮が可能です。主に、映像データ、音声データ、画像データなどの圧縮に利用されます。
データ圧縮の仕組みは、主にデータが有する冗長性・出現確率性・不要性を考慮して変換し、符号化します。
最初の冗長性の例では、ランレングス符号化があります。
これは繰り返されるデータからなるストリングで構成されます。
ファクシミリのデータの圧縮などで利用されています。
次に出現確率性の例では、ハフマン符号化が挙げられます。
ハフマン符号化では、シンボルの出現頻度が異なることを利用し、出現頻度が高いものは少ないものよりビット数を少なく表現します。このような処理を行うことでデータ量を少なくできます。
JPEGやZIPといった圧縮フォーマットで使用されます。
不要性に関しては、データ中の重要度の低いデータを削除するといった手法を用いるもので、不可逆圧縮の典型的な例です。
圧縮の効果を測るものとして圧縮率や圧縮比などがあります。
「圧縮率」は、主に圧縮後の情報量について、圧縮前の情報量に対する割合をパーセントで表示します。
圧縮率=圧縮後の情報量/圧縮前の情報量×100 %(単位)
情報量はデータサイズであることもあり、又音声や動画などの転送レートで示されることもあります。
また、「圧縮比」は圧縮前の情報量と圧縮後の情報量の比で表したものです。
圧縮比=圧縮前の情報量:圧縮後の情報量
デジタル圧縮においては、ファイル圧縮、静止画圧縮、動画圧縮、音声圧縮などに分けられます。
ファイル圧縮は、可逆圧縮でありzip形式・lzh形式・rar形式・sit形式・7z形式・cab形式などがあります。
この中で主にzip形式・lzh形式・rar形式が使用されご存じの方も多いかと思います。
zip形式は米国主流で一般的にパーソナルコンピュータの標準サポートとして使われるものです。
lzh形式はこれに対して処理速度が速いという特徴があります。
rar形式はこの中では圧縮率が最も高いものです。
静止画圧縮は、代表的なものとしてJPEG、GIFがあります。
いずれも非可逆圧縮で高効率圧縮を実現するものと、可逆圧縮で品質を保持するものがあります。
JPEGは、グラデーションや色使いの面で有利でWebの写真などに採用されています。
これに対して、GIFは容量が少なくできる反面、色が256色最大で表現されるため写真より、イラスト、ロゴなど色が多用されないものに適しています。
動画圧縮においては、コーデックとコンテナ(フォーマットとも呼びます)の区別があります。
「コーデック」は動画ファイルを圧縮する符号化を示し、「コンテナ」は圧縮された動画ファイルに拡張子のついたものを示します。
ここでは「コーデック」に関して説明します。
コーデックでは、H.264が広く使われており、YouTubeなどでも使用されています。
AV1は圧縮率が最も高いと言われており、米国で開発され将来的に有望視されています。
MPEG-4はMPEG-2より圧縮率をさらに高めたもので、モバイル機器での視聴に適するものです。
ほかに、Googleが開発したVP9やMicrosoftが開発したWMV9などの形式があります。
また、高画質化で可逆圧縮、非可逆圧縮いずれにも対応するAMV Video CodecやHuffyuvなどもあります。
音声圧縮では、非可逆圧縮としてドルビーデジタルのAC-3、ミニディスク(MD)で使用されているATRAC、MPEGオーディオ用としてMP3などがあります。
また、可逆圧縮としてはiTunesなどで使用のApple Lossless、DVD等で使用されているMLP、国際標準のMPEG-4 ALSなどがあります。
ほかに可逆圧縮、非可逆圧縮いずれにも対応するWMA(Windows Media Audio)やDolby Digital Plus(DD+)などがあります。
動画圧縮、音声圧縮は特に多種多様なものが提案され使用されています。
【主なデータ圧縮技術のまとめ】
ということで、今回はアナログ圧縮に関しては割愛し、デジタル圧縮に関して説明しました。
圧縮のキーとなるのはやはり圧縮の仕組みで話した圧縮手法であり、繰り返しの特性、予測可能性などの特徴を見出し、圧縮比も睨みながらいかにして符号化へと結びつけるかです。(この前提が可逆圧縮か非可逆圧縮なのかも、もちろん重要な要素ですが。)
今後も伸長時の画質、音質などを重視して高効率な圧縮技術開発がさらに進むと思われます。
(日本アイアール株式会社 特許調査部 T・T)