Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

G.729(ジーナナニキュ)とは | 意味や読み方など丁寧でわかりやすい用語解説

G.729(ジーナナニキュ)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

ジーナナニキュウ (ジーナナニキュウ)

英語表記

G.729 (ジーナナニーキュー)

用語解説

G.729は、国際電気通信連合 電気通信標準化部門(ITU-T)が標準化した音声符号化方式の一つであり、特にIP電話やVoIP(Voice over IP)システムで広く利用される。その最大の特長は、非常に低いビットレートである8kbpsで、固定電話に匹敵するクリアな音声品質を実現することにある。この低ビットレートにより、限られたネットワーク帯域を効率的に活用し、同時に多くの通話を行うことが可能となるため、VoIP技術の普及に大きく貢献した重要なコーデックである。過去には特許ライセンスが必要であったが、現在はその制限も解消されており、様々なVoIP製品やサービスに組み込まれている。これにより、システムの導入コストを抑えつつ、高品質な音声通信環境を構築できるようになった。システムエンジニアを目指す者にとって、VoIPの基盤技術としてG.729の特性と役割を理解することは不可欠である。

G.729は、CS-ACELP(Conjugate-Structure Algebraic Code Excited Linear Prediction)と呼ばれる高度なアルゴリズムを基盤とする。このアルゴリズムは、人間の声の発生メカニズムをモデル化し、音声信号を効率的に圧縮する仕組みを持つ。具体的には、音声信号を10ミリ秒(ms)ごとの短いフレームに分割し、それぞれのフレームに対して詳細な分析を行う。エンコーダー(符号化器)はこのフレームごとに、声道の形状を表す「線形予測フィルターの係数」と、声帯の振動や摩擦音などを表す「励起信号」という二つの要素に分析する。線形予測フィルターの係数は、音声の周波数特性や共鳴の情報を保持し、励起信号は声のピッチ(音の高さ)やパワー(音の強さ)の情報を持つ。これらの分析された情報は、それぞれ効率的なコードブック探索と量子化によって非常に少ないビット数で表現される。特に励起信号の符号化には「代数コードブック」という特殊な構造を用いることで、計算負荷を抑えつつ高い圧縮率と音質を両立させている。デコーダー(復号化器)側では、これらの符号化された情報を受け取り、逆のプロセスで元の音声信号を再構築する。この際、線形予測フィルターと励起信号を合成することで、元の音声に近い音声を再生する。この一連の処理によって、G.729はわずかな情報量で高品質な音声伝送を可能にしている。

G.729がVoIP環境で重宝される理由は複数ある。一つは、先述の通り8kbpsという非常に低いビットレートであることだ。これにIPヘッダ、UDP(User Datagram Protocol)、RTP(Real-time Transport Protocol)といったプロトコルオーバーヘッドを加えると、実際には約20~30kbps程度の帯域が必要となるが、それでも他の高品質コーデック、例えばG.711の64kbpsと比較して圧倒的に少ない帯域で済む。これにより、ネットワーク負荷を軽減し、特に帯域幅に制約のある環境や、多くの同時通話を処理する必要がある環境において非常に有利となる。例えば、企業の内線電話システムをIP化する際、通信事業者が提供するVoIPサービス、さらには遠隔地とのテレビ会議システムなど、幅広いシーンで利用される。ネットワークエンジニアやシステムエンジニアは、限られたネットワークリソースの中でいかに多くの通話を安定して提供するかを検討する際に、G.729を選択肢の一つとして考慮する。

また、G.729は音声品質と処理遅延のバランスにも優れている。8kbpsという低ビットレートにもかかわらず、その再生音質は固定電話で使用されるG.711に劣らない明瞭さを保つ。これは、人間の聴覚特性を考慮した符号化が行われているため、聴覚上重要な情報を優先的に保持し、そうでない情報を効率的に圧縮しているからである。処理遅延に関しては、10msのフレーム処理に加えてエンコード・デコードの処理時間が発生するが、これは一般的に実用上問題とならないレベルに抑えられている。低遅延は、円滑な会話において非常に重要な要素であり、特に双方向通信においてその効果を発揮する。遅延が大きすぎると、会話のテンポが悪くなったり、お互いの発言が重なってしまうなどの問題が生じやすくなるため、VoIPシステムの設計においては常に考慮すべき点である。

さらに、G.729にはG.729aやG.729bといったいくつかの派生規格が存在する。G.729aは、オリジナル版であるG.729と比較して計算処理を簡略化し、より少ないCPUリソースで動作できるようにしたものであり、組み込み機器などでの実装を容易にする。音質はオリジナル版とほぼ同等だが、計算負荷の低減が特徴である。G.729bは、VAD(Voice Activity Detection)機能とCNG(Comfort Noise Generation)機能を実装している。VADは、通話中に音声信号がない無音区間を検出し、その間はデータを送らないようにすることで、さらにネットワーク帯域を節約する。しかし、完全に無音だと通話が途切れたように感じる場合があるため、CNGが作動し、擬似的な背景ノイズを生成して自然な会話状態を保つ。これらの派生規格は、基本的なG.729の枠組みは維持しつつ、特定の用途や環境に合わせて最適化されている。

過去には、G.729の特許技術に関してライセンス料の支払いが必要であったため、その利用にはコストが伴った。これは一部のオープンソースプロジェクトや小規模なシステムでの採用を躊躇させる要因ともなった。しかし、2017年1月からは主要な特許が失効し、ライセンス料が不要となった。これにより、G.729はより自由に利用できるコーデックとなり、その普及と採用がさらに加速した。現在では、多くのIP電話機、VoIPゲートウェイ、ソフトウェア電話、PBX(構内交換機)などで標準的にサポートされるコーデックの一つとなっている。システムエンジニアにとって、VoIPシステムを設計・構築する際には、G.729が持つ低ビットレート、高品質、低遅延という特徴を理解し、ネットワーク環境や要件に応じて適切な場面で活用することが求められる重要な知識である。

関連コンテンツ