Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

PCM(ピーシーエム)とは | 意味や読み方など丁寧でわかりやすい用語解説

PCM(ピーシーエム)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

パルス符号変調 (パルスゴウドヘンチョウ)

英語表記

Pulse Code Modulation (パルスコード 変調)

用語解説

PCMは、Pulse Code Modulation(パルス符号変調)の略であり、アナログ信号をデジタル信号に変換するための最も基本的な技術の一つである。我々が日常的に利用するあらゆるデジタル音声や動画の基盤となっており、固定電話や携帯電話での通話、音楽CDやストリーミングサービス、デジタルテレビ放送など、その応用範囲は非常に広い。人間の声や楽器の音といった連続的な物理現象であるアナログ信号は、そのままではコンピュータで直接扱うことができない。これをコンピュータが理解できる0と1のデジタルデータに変換し、保存、伝送、加工、再生を可能にするのがPCMの役割である。デジタル化することで、アナログ特有のノイズによる劣化を大幅に抑制し、高品質な情報を安定して扱えるようになるという大きなメリットがある。また、デジタルデータは圧縮や暗号化といった様々な処理が可能になり、情報通信技術の発展に不可欠な基盤技術となっている。システムエンジニアを目指す上で、このPCMの原理を理解することは、音声や動画データを扱うシステム開発において非常に重要な基礎知識となる。

PCMでは、アナログ信号をデジタル信号に変換する過程で主に三つのステップを踏む。これらのステップは、サンプリング(標本化)、量子化、符号化と呼ばれる。

最初のステップはサンプリング(標本化)である。アナログ信号は時間的に連続した波形を持つが、これをデジタル化するには、まず一定の時間間隔でその信号の「瞬間の値」を採取する必要がある。この「瞬間を切り取る」行為がサンプリングである。サンプリングする頻度はサンプリング周波数として表され、1秒間に何回信号を採取するかをヘルツ(Hz)単位で示す。例えば、音楽CDでは44.1kHzというサンプリング周波数が使われており、これは1秒間に44,100回、音声信号の値を採取していることを意味する。このサンプリング周波数が高いほど、元の信号の情報をより細かく捉えることができ、再現されるデジタル信号の品質は高くなる。しかし、必要なサンプリング周波数は元の信号が持つ最高周波数によって決まる。ナイキスト・シャノン標本化定理によれば、元の信号に含まれる最高の周波数の2倍以上のサンプリング周波数で標本化すれば、理論上、元の信号を完全に再現できるとされている。人間の可聴域が約20kHzまでであるため、CDの44.1kHzという周波数はこの定理に基づいている。

次に、量子化が行われる。サンプリングによって得られた各時点のアナログ信号の値は、厳密には無限のバリエーションを持つ。しかし、デジタルデータとして表現するには、これらの値を有限の段階的な数値に丸める必要がある。この「丸める」処理が量子化である。量子化の細かさは量子化ビット数によって決まる。例えば、8ビットで量子化する場合、2の8乗、つまり256段階の数値で信号の振幅(音の大きさ)を表現する。16ビットであれば65,536段階、24ビットであれば約1670万段階で表現することになる。量子化ビット数が多いほど、アナログ信号の細かな強弱をより正確に表現でき、デジタル化後の音質や画質は向上する。しかし、量子化の際に、連続的なアナログ値を離散的なデジタル値に変換するため、必ず誤差が生じる。これを量子化誤差と呼び、この誤差が少ないほど高音質・高画質となる。

最後のステップは符号化である。量子化された段階的な数値は、最終的にコンピュータが扱える二進数(0と1の並び)のデジタルデータに変換される。例えば、量子化によって「5」という値が得られた場合、これが二進数の「101」として表現されるといった具合である。この二進数の列は、電気信号の有無(ON/OFF)や磁気の向きといった物理的なパルスとして伝送または記録される。これが「パルス符号変調」という名称の由来である。

PCMによって生成されたデジタルデータは、ノイズに極めて強いという大きな利点を持つ。伝送中に多少信号が弱まったりノイズが混入したりしても、0か1かの区別さえできれば元の情報を完全に復元できるため、情報劣化がほとんどない。また、デジタルデータであるため、複製しても音質や画質が劣化せず、様々な加工や編集が容易に行える。さらに、複数のデジタル信号を時分割多重化(TDM)などの技術を用いて一つの回線で送ることも可能になり、通信効率が大幅に向上する。

しかし、PCMのデータは非圧縮であるため、そのままではデータ量が非常に大きくなる傾向があるという側面も持つ。例えば、16ビット、ステレオ(2チャンネル)、44.1kHzサンプリングの音声データは、1秒あたり1.4メガビット以上のデータ量となる。このため、より効率的な伝送や保存のために、MP3やAAC、H.264などの圧縮技術が開発されてきた。これらの圧縮技術は、PCMによってデジタル化されたデータを元に、人間の知覚特性などを利用して非可逆的または可逆的にデータ量を削減するものであり、PCMがなければ成り立たない技術である。

現代のITシステムにおいて、PCMはデジタル通信、メディア処理、IoTデバイスにおけるセンサーデータ処理、さらには人工知能分野での音声認識や合成など、広範囲な分野でその基盤技術としての役割を担っている。システムエンジニアとして、PCMの基本的な原理とその影響を理解することは、これらの技術を適切に活用し、より高性能で信頼性の高いシステムを設計・開発するために不可欠な知識であると言える。

関連コンテンツ