PR/BLOG

広報・ブログ

はじめての圧縮処理

えりちゃん
1日に水を1ℓ以上飲むことが目標

リーダー堀川氏
本日の講師

はじめに

リーダー堀川氏

今回も個人の興味があるテーマについて学んでいこう。

えりちゃん

データの圧縮について興味があります!

どのような仕組みで圧縮されているのか、圧縮方法の違いについて学びたいです!

リーダー堀川氏

データの圧縮処理についてだね。

圧縮には、画像ファイルや音声ファイルなど様々なデータの圧縮方式があるよ。

まずは、どのようなファイル形式なのかを識別することができる拡張子から見ていこう。

拡張子について

ファイルの種類を識別するために、ファイル名の末尾に付けられる文字列。
ファイル名と拡張子の間は.(ドット)で区切られる。

一般的に使われる拡張子の種類

えりちゃん

種類によって、様々な拡張子とファイル形式がありますね。

リーダー堀川氏

後述で少し触れるけど、JPEGやPNGなどは圧縮方式の一種にあたるよ。
続いて、データ圧縮について学んでいこう。

データ圧縮について

データ圧縮とは、冗長性のあるデータを
情報量を減らした別のデータに置き換えること。高効率符号化。
「可逆圧縮方式」と「非可逆圧縮方式」の2種類がある。

可逆圧縮方式

  • データを置き換えることでデータ量を小さくすることが可能。
  • 圧縮率は低くなるが、圧縮後のデータから圧縮前のデータを完全に復元できるデータ圧縮方法。
  • 主にファイルの圧縮方式で用いられる。
  • 代表的な可逆圧縮方式 : GIF、PNG、ZIPなど。

非可逆圧縮方式

  • 不要な情報を削除し、元データへの復元を考慮せず計算できるため、高い圧縮率でデータ量を小さくすることが可能。
  • 圧縮前のデータに似せた状態を復元できるが、圧縮前のデータと圧縮後のデータが完全には一致しないデータ圧縮方法。
  • 主に画像や動画、音声などの圧縮方式で用いられる。
  • 代表的な非可逆圧縮方式 : JPEG、MP3、MPEG-1/2/4、WMV9など。
えりちゃん

データの細部が異なっていても、人間の視覚や聴覚では違いが気づきにくいので、
画像や動画などの圧縮形式で非可逆圧縮が多く採用されているんですね。

リーダー堀川氏

そうだね。続いて、実際にどのような仕組みでデータを圧縮しているのか、
圧縮アルゴリズムを紹介するよ。

圧縮アルゴリズム

ランレングス符号化

圧縮アルゴリズムの一つで、文字列の中で同じ文字(符号)が
繰り返される場合に繰り返し部分を反復回数と文字の組に置き換えて文字列を短くする方法。
ファクシミリなど単純な画像データの圧縮方式で用いられる。

次のようなデータがある場合、
Aが7回、Bが4回、Cが5回、Dが3回、Eが1回繰り返し連続しているため、
回数と文字の組に置き換えて以下のように表すことが可能。

ハフマン符号化

圧縮アルゴリズムの一つで、出現率が高いデータに短い符号を与え
出現率が低いデータには長い符号を与えることで効率よく圧縮を行う方法。
JPEGやZIPなどの圧縮方式で用いられる。

ハフマン符号は可変長符号を表す。
例として、次のようなデータがある場合、固定長符号化を行うと以下のように表示される。

えりちゃん

どちらのアルゴリズムでも圧縮前と比べてデータが小さくなっていますね。

このようなアルゴリズムによって圧縮処理が行われていたんですね!

おわりに

えりちゃん

データが圧縮される仕組みについて、圧縮アルゴリズムが使われ
様々な技術があることを知りました!

リーダー堀川氏

圧縮処理は用途に合わせて適切な手法を利用することで、効率的に情報伝達が可能になるよ。
他にも様々な技術があるから調べてみてね。

えりちゃん

他の技術についても学んでみたいと思います!

リーダー堀川氏

今年度の技術者への道ブログは今回で終了するよ。
今後も情報処理技術について学んでいこうね!

一覧に戻る
ゆりちゃん

技術開発推進部ゆりちゃんからのお願い顔マークを押して、技術ブログの
感想をお聞かせください^^