Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

tar.gz(ターゼットジーゼット)とは | 意味や読み方など丁寧でわかりやすい用語解説

tar.gz(ターゼットジーゼット)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

タールジェイピーイーグゼ (ターゲッテイーエックスイー)

英語表記

tar.gz (ターゼットジーゼット)

用語解説

tar.gzは、複数のファイルやディレクトリを一つにまとめ、さらにそれを圧縮して保存する形式である。これは、特にUNIX系OS環境において、ソフトウェアの配布、バックアップ、あるいは多数のファイルをまとめて転送する際によく利用される標準的な形式だ。その名称が示す通り、「tar」と「gzip」という二つの異なるツールが組み合わさって機能している。この形式を理解することは、システムエンジニアとしてファイル管理やソフトウェアのデプロイを行う上で基礎となる。

まず、tarは「Tape ARchive」の略であり、元々はデータをテープメディアにアーカイブするために開発されたコマンドラインユーティリティである。tarの主な機能は、複数のファイルやディレクトリを、そのディレクトリ構造、ファイルのパーミッション(アクセス権)、タイムスタンプ、シンボリックリンクといったメタデータ情報を保持したまま、一つの大きなファイルにまとめることである。このまとめる作業は「アーカイブ化」と呼ばれる。重要な点として、tarコマンド自体にはファイルサイズを削減する「圧縮」の機能は含まれていない。あくまで、バラバラのファイルを一つに統合する役割を果たす。例えば、あるディレクトリとその中身すべてを一つのファイルにしたい場合、tarコマンドを使うことで、そのディレクトリ構造を忠実に再現した「.tar」という拡張子を持つアーカイブファイルが作成される。これにより、多数のファイルを手作業で一つずつ管理する手間が省け、またファイル転送の効率も向上する。

次に、gzipは「GNU zip」の略であり、データを圧縮するためのユーティリティである。gzipの主な機能は、単一のファイルのサイズを削減すること、つまり「圧縮」することである。gzipは、元のファイルの内容を数学的なアルゴリズムを用いてより少ないデータ量で表現することで、ファイルのディスク占有量を減らす。この圧縮は可逆圧縮であり、いつでも元の状態に完全に復元(解凍)できる。gzipが圧縮できるのは原則として単一のファイルのみであり、ディレクトリを直接圧縮することはできない。gzipコマンドを使ってファイルを圧縮すると、通常は元のファイル名に「.gz」という拡張子が付加された圧縮ファイルが作成され、元のファイルは削除される。例えば、「document.txt」というファイルをgzipで圧縮すると、「document.txt.gz」というファイルができあがる。

tar.gzという形式は、これら二つの機能が連携して動作することで成り立っている。具体的には、まずtarコマンドによって複数のファイルやディレクトリが単一の「.tar」アーカイブファイルにまとめられ、その後にその「.tar」ファイル全体がgzipコマンドによって圧縮される。この結果として、「.tar.gz」という拡張子を持つファイルが生成されるのである。このプロセスは、通常、tarコマンドが持つ組み込みのオプションを利用することで、一度のコマンド実行で完結できる。例えば、あるディレクトリをtar.gz形式でアーカイブと圧縮を同時に行うには、「tar -czvf archive.tar.gz target_directory/」のようなコマンドが用いられる。ここで、「-c」はアーカイブを作成する(create)、「-z」はgzipで圧縮する(gzip)、「-v」は処理の進捗を表示する(verbose)、「-f」はアーカイブのファイル名を指定する(file)という意味を持つオプションである。

tar.gzファイルの展開(解凍とアーカイブの展開)も同様に、tarコマンドのオプションを組み合わせることで一度に行える。例えば、「tar -xzvf archive.tar.gz」というコマンドを実行すると、「-x」オプション(extract)がアーカイブからファイルを取り出し、「-z」オプションがgzipによる解凍を自動的に行い、元のディレクトリ構造とファイルが復元される。

このtarとgzipの組み合わせが広く普及している理由はいくつかある。一つは、tarがファイル構造やメタデータを忠実に保持したままアーカイブする能力に優れており、UNIX系OSのファイルシステムと非常に親和性が高いこと。もう一つは、gzipが高速かつ効率的な圧縮を提供し、多くのシステムで標準的に利用可能であることである。これらの特性により、tar.gzはソフトウェアのソースコード配布、システムバックアップ、Webサーバーにおけるファイルの転送など、多岐にわたる用途で信頼性の高いパッケージング形式として重宝されている。

また、gzip以外にも、bzip2やxzといった別の圧縮ツールとtarを組み合わせて利用することもあり、それぞれ「.tar.bz2」や「.tar.xz」といった拡張子を持つ。これらはgzipよりも高い圧縮率を提供するが、その分圧縮・解凍に時間がかかる傾向がある。しかし、速度と圧縮率のバランス、そして高い互換性という点で、tar.gzは依然として最も普及しているアーカイブ圧縮形式の一つであり、システムエンジニアを目指す上ではその仕組みと操作方法を習得しておくことは不可欠だ。

関連コンテンツ