Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

ISO/IEC 8859(アイエスオーアイイーシーはちまんはちせんきゅうじゅうはち)とは | 意味や読み方など丁寧でわかりやすい用語解説

ISO/IEC 8859(アイエスオーアイイーシーはちまんはちせんきゅうじゅうはち)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

アイエスオー/アイイーシー 八八五九 (アイエスオー/アイイーシー ハチハチゴキュウ)

英語表記

ISO/IEC 8859 (アイエスオーアイイーシーはちまんさんはちまんきゅう)

用語解説

ISO/IEC 8859は、コンピュータで文字を扱うためのルールを定めた文字コード規格の一つである。国際標準化機構(ISO)と国際電気標準会議(IEC)によって標準化された。この規格は、主にラテン文字(アルファベット)を使用するヨーロッパの各言語を表現するために設計されている。ISO/IEC 8859は単一の規格ではなく、対象とする言語圏ごとに複数のパート(部分)に分かれた規格群、いわば文字コードのファミリーである点が大きな特徴である。その基本となったのは、英語圏で広く使われていたASCIIコードである。ASCIIは7ビットで128種類の文字や記号、制御文字を表現するが、アクセント記号付きの文字など、英語以外のヨーロッパ言語で必要とされる文字を含んでいなかった。そこで、コンピュータのデータ単位として一般的な8ビット(1バイト)をフルに使い、ASCIIの128文字に加えて、さらに128文字を追加して合計256文字を扱えるように拡張したのがISO/IEC 8859である。この拡張性により、多くの西ヨーロッパ言語に対応することが可能になった。

ISO/IEC 8859の構造は非常に体系的である。8ビットで表現される256のコードポイントのうち、下位128個(16進数で0x00から0x7F)は、先行するASCIIコードと完全に同一の文字が割り当てられている。これにより、ASCIIで作成されたテキストデータとの互換性が保たれ、既存のシステムやソフトウェアへの導入が容易になった。規格の核心部分は、上位128個(0x80から0xFF)のコードポイントである。この領域に、各パート固有の文字が定義される。例えば、フランス語で使われる「ç」やドイツ語の「ü」といった文字がこの上位領域に含まれる。しかし、8ビットで追加できる文字は128文字に限られるため、ヨーロッパの全ての言語で使われる固有の文字を一つの文字コード体系に収めることは不可能だった。この問題を解決するために、ISO/IEC 8859は言語圏ごとに異なる文字セットを定義するパート方式を採用した。最も広く知られているのが「ISO/IEC 8859-1」で、「Latin-1」とも呼ばれる。これは西ヨーロッパの主要言語(フランス語、ドイツ語、スペイン語、イタリア語など)で使われる文字の多くをカバーしており、初期のインターネット、特にHTMLの標準文字コードとして広く採用された。他にも、中央・東ヨーロッパ言語向けに設計された「ISO/IEC 8859-2 (Latin-2)」、キリル文字(ロシア語など)を対象とする「ISO/IEC 8859-5」、ギリシャ文字のための「ISO/IEC 8859-7」など、合計で15のパートが存在する。後に、ユーロ通貨記号「€」などを追加するためにLatin-1を改訂した「ISO/IEC 8859-15 (Latin-9)」も策定された。このパート方式により、多くの言語をサポートできるようになった一方で、どのパートの規格で書かれたテキストなのかを正しく指定しないと、意図しない文字が表示される、いわゆる「文字化け」の原因ともなった。

現代のシステム開発において、ISO/IEC 8859が新規に採用されることは稀である。その理由は、世界中のあらゆる文字を単一の体系で扱うことを目指すUnicodeという、より包括的な文字コード規格が普及したためである。Unicodeとその符号化方式であるUTF-8は、言語ごとに文字コードを切り替える必要がなく、多言語を同時に扱うことができるため、現在のグローバルなIT環境における標準となっている。しかし、ISO/IEC 8859の歴史的意義は非常に大きい。特にISO/IEC 8859-1は、Unicodeの設計に大きな影響を与えた。Unicode規格における最初の256文字(U+0000からU+00FF)は、ISO/IEC 8859-1の文字と完全に一致するように定められている。この設計上の配慮により、既存のLatin-1で書かれたデータからUnicodeへの移行がスムーズに進んだ。システムエンジニアにとって、ISO/IEC 8859の知識は、古いシステムやデータベース、過去に作成されたテキストファイルなどを扱う際に不可欠となることがある。データの文字コードを正しく識別し、必要に応じてUnicodeへ変換する作業などにおいて、この規格の構造や各パートの特徴を理解していることが、問題解決の鍵となる。したがって、ISO/IEC 8859は過去の技術ではあるが、その概念は現代のエンジニアにとっても重要な基礎知識の一つと言える。

関連コンテンツ