Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

G.711(ジーナナイチイチ)とは | 意味や読み方など丁寧でわかりやすい用語解説

G.711(ジーナナイチイチ)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

ジーナナイチイチ (ジーナナイチイチ)

英語表記

G.711 (ジーナナイチイチ)

用語解説

G.711は、国際電気通信連合電気通信標準化部門(ITU-T)が勧告する音声符号化方式の一つである。これは、アナログの音声信号をデジタルデータに変換するための標準的な手法であり、主に公衆交換電話網(PSTN)における音声伝送の基盤技術として広く利用されている。現在では、インターネットプロトコル(IP)電話システム、いわゆるVoIP(Voice over IP)においても標準的なコーデック(符号化・復号化器)として広く採用されている。そのシンプルさ、高い音質、そして既存の電話システムとの高い互換性から、デジタル音声通信の分野で不可欠な存在となっている。

G.711の歴史は、アナログ電話信号を効率的かつ高品質にデジタル化する必要性から始まった。電話網がアナログからデジタルへと移行する過程で、異なる通信機器やネットワーク間で互換性のある音声フォーマットが強く求められたため、ITU-Tが国際的な標準としてこの勧告を定めたのである。G.711は、パルス符号変調(PCM: Pulse Code Modulation)という技術に基づいており、これがG.711の中核をなす原理である。

PCMは、アナログ音声信号をデジタル化する際の基本的なプロセスである。このプロセスは、主に「標本化(サンプリング)」「量子化」「符号化」の三つの段階から構成される。まず、標本化の段階では、連続的なアナログ信号を一定の時間間隔で測定し、その時点の信号の振幅値を採取する。G.711では、人間の会話における主要な周波数帯域(一般的に約300Hzから3.4kHz)を効率的にカバーするため、1秒間に8000回の頻度で標本化を行う。この8kHzという標本化周波数は、ナイキストの定理に基づいており、元の信号が持つ最高周波数の2倍以上の頻度でサンプリングすることで、元の信号の情報を失うことなくデジタル化できることを保証する。8kHzで標本化することで、最大4kHzまでの周波数成分を再現でき、これは電話通話に必要十分な音質とされている。

次に、量子化の段階では、標本化によって得られたアナログの振幅値を、離散的なデジタル値に変換する。このとき、G.711では8ビットのデータを使用して値を表現する。つまり、各標本値は2の8乗、すなわち256段階のいずれかの値に割り当てられる。しかし、単純に線形な(等間隔な)量子化を行うと、声の小さい部分(微弱な信号)の表現精度が低くなり、ノイズが目立ちやすくなるという問題が生じる。これは、人間の聴覚が、大きな音よりも小さな音の変化に対してより敏感であるという特性を持つため、これを考慮したデジタル化が必要だからである。

この問題を解決するため、G.711では「非線形量子化」という手法を採用している。これは、信号の振幅が小さい範囲では細かく、振幅が大きい範囲では粗く量子化するという方法である。これにより、小さな信号のS/N比(信号対雑音比)を効果的に改善しつつ、幅広い音量レベルを効率的に表現できるようになる。非線形量子化には「μ-law(ミューロー)」と「A-law(エーロー)」の二つの方式があり、それぞれ異なる数学的特性を持つ。μ-lawは主に北米や日本で利用され、A-lawはヨーロッパや世界中の他の地域で広く利用されている。両者はいずれも、信号のダイナミックレンジを効率的に圧縮し、人間の聴覚特性に合わせた高音質なデジタル化を実現する役割を果たす。

標本化と量子化の後、デジタル化されたデータを符号化する。G.711では、8kHzの標本化周波数と8ビットの量子化ビット数を用いるため、1秒あたりのデータ量は「8000サンプル/秒 × 8ビット/サンプル = 64,000ビット/秒」、つまり64kbpsとなる。この64kbpsという帯域幅は、「DS0(Digital Signal 0)」として知られ、デジタル電話網における基本的な回線速度の単位として確立されている。

G.711の最大の利点は、そのシンプルさに起因する低遅延性と高い音質である。複雑な圧縮アルゴリズムをほとんど含まないため、符号化・復号化にかかる処理時間が非常に短く、通話における遅延を最小限に抑えることができる。また、音声信号の情報をほとんどそのままデジタル化するため、他の高圧縮コーデックと比較して音質劣化が少ない。この特性から、高品質な音声が求められる電話会議システムや、既存のPSTNとの連携が不可欠なVoIP環境において、G.711は依然として重要な選択肢であり続けている。

一方で、G.711にはいくつかの欠点も存在する。最大の欠点は、64kbpsという比較的大きな帯域幅を消費することである。インターネット回線などの限られた帯域幅しか利用できない環境や、多数の同時通話が必要な環境では、より低いビットレートで運用できる他の音声コーデック(例えばG.729やG.722など)が優先される場合がある。また、G.711は複雑な圧縮アルゴリズムを持たないため、パケットロスやネットワークのゆらぎ(ジッタ)に対する耐性は他のコーデックに比べて低い傾向にある。これは、ネットワーク上で一部のデータが失われたり、到達が遅れたりした場合に、元の音声を再構築することが難しく、音切れや品質劣化が発生しやすいことを意味する。

しかし、これらの欠点があるにもかかわらず、G.711は今日においても多くの通信システムでその役割を果たし続けている。特に、VoIPゲートウェイやIP-PBXといった機器においては、PSTNとの相互接続のためにG.711が必須のコーデックとなっていることが多い。これは、PSTN側がG.711を標準として運用しているため、異なるシステム間でのシームレスな音声通信を実現するためには、G.711に対応することが不可欠だからである。今日の多様な通信環境において、G.711はデジタル音声通信の基本的な「共通言語」として、その重要性を維持しているのである。

関連コンテンツ