Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

RAWデータ(ロウデータ)とは | 意味や読み方など丁寧でわかりやすい用語解説

RAWデータ(ロウデータ)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

ローデータ (ローデータ)

英語表記

RAW data (ロウデータ)

用語解説

RAWデータとは、デジタルデバイスやセンサーが取得した情報を、一切加工せず、あるいは最小限の非可逆圧縮にとどめて保存した、生の状態のデータを指す。その名前が示す通り、「生の」「未加工の」データであり、特定のアプリケーションや用途に合わせて整形される前の、情報源に最も近い状態のデータである。このデータは、情報が失われる圧縮(非可逆圧縮)や、色調補正、ホワイトバランス調整、シャープネス処理といった画像処理、あるいはノイズ除去などの信号処理が適用されていないため、取得時のすべての情報を含んでいるという特性を持つ。

概要

RAWデータは、デジタルカメラのイメージセンサー、音声録音デバイスのマイク、IoTデバイスの各種センサー(温度、湿度、加速度など)、医療用画像診断装置など、様々なデジタル情報源から生成される。これらのデバイスは、外界の物理的な情報(光、音、温度など)を電気信号に変換し、さらにその電気信号をデジタル値に変換することでデータとして記録する。この「デジタル値に変換された直後の状態」がRAWデータである。例えば、デジタルカメラの場合、イメージセンサーが受け取った光の強弱を画素ごとに電気信号に変換し、それをアナログ-デジタル変換器(ADC)を通してデジタル値に変換する。このデジタル値が、カメラ内でJPEGなどの最終的な画像形式に変換される前のRAWデータとなる。この段階では、まだ人間の目で見えるような整った画像ではなく、単なる数値の羅列に近い。この情報の「純粋さ」がRAWデータの最も重要な特徴であり、後の処理において最大限の柔軟性と最高の品質を確保するための基盤となる。

詳細

RAWデータの技術的な側面は多岐にわたる。まず、データの取得プロセスにおいて、センサーは光や音などのアナログ情報を連続的な電気信号として出力する。このアナログ信号は、アナログ-デジタル変換器によって離散的なデジタル値へと変換される。この変換されたデジタル値が、デバイス固有のRAWデータ形式でメモリやストレージに書き込まれる。この際、多くのRAWデータは非圧縮であるか、あるいは情報が失われないロスレス圧縮が施されるため、取得されたオリジナルの情報が完全に保持される。これがJPEGなどの非可逆圧縮形式と決定的に異なる点である。非可逆圧縮では、ファイルサイズを削減するために人間の知覚では気付きにくい情報が永久に削除されるが、RAWデータではそのような情報の欠落は発生しない。

RAWデータの具体的な内容としては、センサーが取得した個々のピクセル(画素)の生データ、つまり光の強度に関する数値情報が中心となる。デジタルカメラの場合、カラーフィルターアレイ(ベイヤーパターンなど)を通してR(赤)、G(緑)、B(青)のいずれかの色情報のみを受け取った単一の画素値の集合体であり、これらを補間して完全なカラー画像を生成する「デモザイク処理」はRAWデータには含まれない。その他、撮影時の詳細なメタデータ(露出設定、ISO感度、ホワイトバランス設定、レンズ情報、デバイスモデルなど)、センサーの種類に関する情報、著作権情報なども含まれることが多い。

RAWデータを利用する最大のメリットは、その高い情報量と後処理の柔軟性にある。 第一に、最高の品質を維持できる点だ。取得時の情報がそのまま保存されているため、色再現性、ダイナミックレンジ(最も明るい部分から最も暗い部分までの階調表現の幅)、ノイズ特性などにおいて、加工済みのデータ形式よりも優れている。これにより、最終成果物の品質を最大限に高めることが可能となる。 第二に、非破壊編集の基盤となる点である。RAWデータ自体を直接変更するのではなく、RAWデータを基に生成される最終イメージに対して処理を適用するため、何度でも異なる設定でやり直すことが可能だ。例えば、デジタル写真において、撮影時のホワイトバランスや露出設定が適切でなかったとしても、RAWデータからであれば、後から自由に調整し直すことができる。これは、JPEGなどの加工済みデータでは、一度適用された処理を元に戻すのが困難であったり、品質劣化を伴ったりするのとは対照的だ。 第三に、将来的な互換性や適応性がある点だ。新しい画像処理アルゴリズムやノイズリダクション技術が開発された場合でも、過去に取得したRAWデータにそれらを適用することで、より高品質な成果物を再生成できる可能性がある。これは、一度加工してしまったデータでは得られない利点である。 第四に、科学技術分野やデータ分析における信頼性である。観測機器やセンサーから得られた生のデータは、加工や補正がされていないため、計測された真の値に最も近く、客観的なデータとして利用できる。これにより、精密な分析、機械学習モデルの訓練データ、または客観的な証拠として活用される際に、その信頼性が非常に高まる。

一方で、RAWデータにはいくつかの課題も存在する。 最も顕著なのが、ファイルサイズの大きさである。非圧縮またはロスレス圧縮であるため、JPEGなどの非可逆圧縮形式と比較して、ファイルサイズが数倍から数十倍になることがある。これは、ストレージ容量の消費や、データの転送、処理にかかる時間の増加につながる。 次に、互換性の問題である。RAWデータには統一された国際規格が少なく、デバイスメーカーごとに独自のRAWデータ形式(例えば、CanonのCR2/CR3、NikonのNEF、SonyのARWなど)が存在する。このため、RAWデータを扱うには、メーカー提供の専用ソフトウェアや、特定のRAW現像に対応した汎用ソフトウェアが必要となる場合が多い。 最後に、利用には追加の処理と専門知識が必要である点だ。RAWデータはそのままでは一般的なアプリケーションで表示・編集できないことが多く、また適切な現像処理を行わないと、その潜在能力を最大限に引き出すことができない。したがって、最終的な出力形式に変換するためには、専用のソフトウェアと、色補正、シャープネス、ノイズリダクションなどの画像処理に関する知識が求められる。

RAWデータの応用は多岐にわたる。デジタル写真の分野では、プロの写真家やハイアマチュアにとって必須のデータ形式であり、作品の品質を最大限に高めるための基盤となっている。また、天文学における観測データ、気象観測データ、医療画像の生データ、IoTデバイスから収集されるセンサーデータなど、科学・工学分野においても、その純粋な情報が精密な分析や研究に不可欠である。音声制作の現場でも、マイクから入力された生の音声データ(WAVなどの非圧縮形式で記録されることも多い)は、後工程でのミキシングやマスタリングにおいて、最大限の音質と調整の自由度を確保するために利用される。このように、RAWデータは、デジタル情報の「源泉」として、様々な分野でその価値を発揮する。

関連コンテンツ