Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

HE-AAC(エイチイーエーエーシー)とは | 意味や読み方など丁寧でわかりやすい用語解説

HE-AAC(エイチイーエーエーシー)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

ハイ・エンハンスド・アドバンスト・オーディオ・コーディング (ハイエンハンストアドバンストオーディオコーディング)

英語表記

HE-AAC (エイチイーエーツィー)

用語解説

HE-AACはHigh-Efficiency Advanced Audio Codingの略称であり、音声データをデジタル化して圧縮するための技術、すなわち音声コーデックの一種である。この技術の最大の特徴は、非常に低いビットレート、つまり1秒あたりに送信するデータ量が少ない状況においても、実用的な音質を維持できる点にある。この高い圧縮効率により、主にインターネットを介した音楽ストリーミングサービスやインターネットラジオ、モバイル機器向けのデジタル放送など、通信帯域が限られているか、あるいはデータ通信量を節約したい場面で広く採用されている。HE-AACは、高音質コーデックとして知られるAAC(Advanced Audio Coding)をベースに、さらなる効率化を追求して開発された拡張規格という位置づけである。

HE-AACがなぜ低いビットレートでも高い音質を実現できるのかを理解するためには、その中核をなす二つの主要技術、SBR(Spectral Band Replication)とPS(Parametric Stereo)を知る必要がある。まず、SBRは日本語で「スペクトル帯域複製」と訳される技術である。音声信号は様々な周波数の音の集まりで構成されているが、SBRは、音の基本的な特徴を決定づける低周波数帯域から中周波数帯域のデータのみを重点的に符号化(エンコード)する。そして、データ量が多くなりがちな高周波数帯域の情報は直接符号化せず、代わりに低・中周波数帯域のデータパターンから予測して、受信側で復元(複製)する仕組みを持つ。これは、人間の聴覚特性上、高周波成分の微妙な変化には比較的気づきにくいという性質を巧みに利用したものである。高周波成分のデータを大幅に削減することで、全体のデータ量を劇的に圧縮しながらも、聴感上の音の広がりや明瞭感を損なうことなく再現することを可能にする。このSBR技術をAACに組み合わせたものがHE-AAC v1と呼ばれる。

次にもう一つの技術であるPSは、「パラメトリックステレオ」を意味し、主にHE-AAC v2と呼ばれるバージョンで採用されている。この技術は、ステレオ音声のデータ量をさらに削減するために考案された。通常のステレオ音声は、左右二つの独立したチャンネルの音声データで構成されるため、モノラル音声の約2倍のデータ量を必要とする。PSでは、まず左右のチャンネルの音声を合成して一つのモノラル信号を作成する。それに加えて、元のステレオ音源が持っていた左右の音の音量差、位相差、定位といった空間的な情報を、「パラメータ」と呼ばれるごく少量の付加情報として抽出して記録する。音声データを受信した再生機器(デコーダ)は、このモノラル信号とパラメータ情報を基にして、元のステレオ音声に近い音場を再構築する。これにより、ステレオの臨場感を保ちながら、データ量をモノラル音声とほぼ同等レベルまで削減することが可能となり、特に低いビットレートでのステレオ音声配信において絶大な効果を発揮する。

HE-AACの利点は、前述の通り、極めて高いデータ圧縮効率にある。64kbps以下の低ビットレート環境において、同程度のビットレートのMP3や素のAACと比較して、明らかに優れた音質を提供する。これにより、モバイルネットワークのように通信速度が不安定な環境でも音途切れの少ない安定したストリーミングが実現でき、ユーザーのデータ通信量の節約にも貢献する。一方で、欠点も存在する。SBRやPSは元の音声信号を近似的に再構築する技術であるため、原音との完全な一致を保証するものではない。そのため、非常に高い忠実性が求められる音楽制作の現場や、高音質なオーディオ鑑賞を目的とする用途には必ずしも最適とは言えない。また、符号化および復号の処理がAACに比べて複雑になるため、より高い計算能力(CPUパワー)を必要とする傾向がある。

具体的な利用例としては、日本の携帯端末向け地上デジタル放送である「ワンセグ」の音声部分で全面的に採用されているほか、世界中の多くのインターネットラジオ局、ポッドキャスト配信、そして大手音楽ストリーミングサービスにおいて、通信環境に応じた音質設定の一つとして利用されている。システムエンジニアとしては、コンテンツ配信システムを設計する際に、ユーザーの利用環境が多様であることを想定し、高音質な環境向けのコーデックと、通信帯域が限られた環境向けのHE-AACのような高効率コーデックを適切に使い分ける知識が求められる。HE-AACは、データ効率と品質のバランスを追求した結果生まれた、現代のネットワーク社会に不可欠な音声技術の一つであると言える。

関連コンテンツ