【PHP8.x】preg_match関数の使い方

preg_match関数の使い方について、初心者にもわかりやすく解説します。

作成日: 更新日:

基本的な使い方

preg_match関数は、指定された文字列が特定の正規表現パターンにマッチするかどうかを調べる関数です。この関数は、文字列の中から特定の形式のデータを検索したり、ユーザーからの入力値が正しい形式であるかを検証したりする際に非常に役立ちます。

関数の基本的な使い方として、第一引数には検索したい正規表現パターンを、第二引数には検索対象となる文字列を指定します。正規表現パターンは、通常スラッシュ(/)などのデリミタで囲む必要があります。例えば、メールアドレスの形式チェックや、特定のキーワードが含まれているかの確認などに利用できます。

もし、マッチした内容を詳細に取得したい場合は、第三引数に空の配列変数を渡すことができます。この配列には、全体のマッチだけでなく、正規表現内で括弧(())を使って定義された部分(キャプチャグループ)のマッチ結果も格納されます。これにより、文字列から必要な部分だけを効率的に抽出することが可能です。

関数の戻り値は、パターンにマッチする部分が見つかった場合に1を、一つもマッチしなかった場合に0を返します。また、正規表現の構文に誤りがあるなど、エラーが発生した際にはfalseを返しますので、適切なエラーハンドリングを行うことが重要です。preg_match関数は、高度な文字列処理を簡潔に記述できるため、システム開発において多岐にわたる場面で活用される、非常に強力なツールです。

構文(syntax)

1int|false preg_match(string $pattern, string $subject, array &$matches = null, int $flags = 0, int $offset = 0)

引数(parameters)

string $pattern, string $subject, array &$matches = null, int $flags = 0, int $offset = 0

  • string $pattern: 検索する正規表現パターンを指定する文字列
  • string $subject: 検索対象の文字列
  • array &$matches = null: 正規表現にマッチした部分文字列を格納する配列。参照渡しされるため、関数実行後に内容が更新されます。
  • int $flags = 0: 検索の挙動を制御するフラグを指定する整数
  • int $offset = 0: $subject のどこから検索を開始するかを指定する整数

戻り値(return)

int|false

正規表現パターンに文字列がマッチしたかどうかを示す整数値、またはマッチしなかった場合は false を返します。

サンプルコード

PHP preg_match で最初の文字列を検索する

1<?php
2
3/**
4 * 文字列内で正規表現パターンに最初に一致する部分を検索します。
5 *
6 * この関数はPHPのpreg_match関数を使用して、正規表現による単一マッチングの基本を示します。
7 * preg_match_allは文字列内の全ての出現を検索するのに対し、preg_matchは最初に見つかった一致のみを検索します。
8 *
9 * @param string $subject 検索対象の文字列。
10 * @return void
11 */
12function demonstratePregMatchBasic(string $subject): void
13{
14    // 検索したい正規表現パターンを定義します。
15    // この例では、「PHP」という単語を検索します。
16    // かっこ () は「キャプチャグループ」と呼ばれ、一致した部分を個別に取得できます。
17    // i 修飾子は、大文字・小文字を区別しないマッチングを意味します。
18    $pattern = '/(PHP)/i';
19
20    echo "対象文字列: \"" . $subject . "\"\n";
21    echo "検索パターン: \"" . $pattern . "\"\n\n";
22
23    // preg_match関数を実行します。
24    // - $pattern: 検索する正規表現
25    // - $subject: 検索対象の文字列
26    // - $matches: 検索結果を格納する配列 (参照渡し)。
27    //            $matches[0]にはパターン全体の一致、
28    //            $matches[1]以降にはキャプチャグループの一致が格納されます。
29    // 戻り値は一致した回数 (0または1) です。一致しない場合はfalseを返します。
30    if (preg_match($pattern, $subject, $matches)) {
31        echo "一致が見つかりました!\n";
32        echo "---------------------------------\n";
33        echo "完全な一致 (パターン全体): " . $matches[0] . "\n";
34        
35        // キャプチャグループが存在する場合、それらも表示
36        if (isset($matches[1])) {
37            echo "キャプチャグループ1の一致: " . $matches[1] . "\n";
38        }
39
40        echo "\n全てのマッチ情報 (配列形式):\n";
41        print_r($matches);
42    } else {
43        echo "一致は見つかりませんでした。\n";
44    }
45}
46
47// 関数の実行例
48demonstratePregMatchBasic("This is a PHP 8.4.12 string.");
49echo "\n=================================\n\n";
50demonstratePregMatchBasic("Another example with php version.");
51echo "\n=================================\n\n";
52demonstratePregMatchBasic("No match here.");
53

PHPのpreg_match関数は、文字列の中から特定のパターン(正規表現)に最初に一致する部分を検索するために使用されます。文字列内に出現する全ての一致を検索するpreg_match_all関数とは異なり、preg_matchは最初に見つかった一致のみを検出します。

この関数は、検索したい正規表現パターンを定義する$pattern、検索対象の文字列を指定する$subject、そして検索結果を格納するための配列である&$matchesという主要な引数を持ちます。$matches配列には、パターン全体に一致した部分が$matches[0]に、正規表現内で指定されたキャプチャグループに一致した部分が$matches[1]以降に格納されます。

関数の戻り値は、一致が見つかった場合に1を返します。一致するパターンが見つからなかった場合は0を返し、正規表現の構文エラーなどによって処理が失敗した場合はfalseを返します。サンプルコードでは、「PHP」という単語を大文字・小文字を区別せずに検索し、一致した場合にその内容とキャプチャグループの情報を表示することで、preg_matchの基本的な使い方と結果の取得方法を示しています。

preg_match関数は、指定された正規表現パターンに対して、対象文字列内で最初に見つかった一致のみを検索し、その情報を取得します。全ての出現を検索したい場合はpreg_match_all関数を使用しますので、混同しないよう注意が必要です。

検索結果は$matches引数の配列に格納され、$matches[0]にはパターン全体の一致、$matches[1]以降には正規表現内のキャプチャグループ(()で囲まれた部分)の一致内容が格納されます。関数は一致した回数(0または1)を返しますが、正規表現が不正な場合など失敗時にはfalseを返します。そのため、戻り値を厳密にチェックし、エラーハンドリングを検討することが安全なコード利用に繋がります。正規表現の特殊文字を文字列として扱いたい場合は、適切にエスケープしてください。

PHP preg_matchで正規表現マッチと取得

1<?php
2
3/**
4 * preg_match関数の基本的な使用例とマッチした値の取得方法を示します。
5 *
6 * この関数は、文字列が特定の正規表現パターンに合致するかどうかをチェックし、
7 * 合致した場合、マッチした部分を配列に格納します。
8 * preg_matchは、最初に見つかったマッチのみを処理します。
9 */
10function demonstratePregMatch(): void
11{
12    // 検証対象の文字列
13    $subject = "今日は2023-10-26です。明日は2023-10-27でしょう。";
14
15    // 日付形式 (YYYY-MM-DD) にマッチする正規表現パターン
16    // かっこ () で囲まれた部分は「キャプチャグループ」と呼ばれ、
17    // マッチした値が $matches 配列に個別に格納されます。
18    // \d{4} は4桁の数字、\d{2} は2桁の数字を表します。
19    // - はリテラルなハイフンです。
20    $pattern = '/(\d{4})-(\d{2})-(\d{2})/';
21
22    echo "--- preg_matchの基本 ---" . PHP_EOL;
23    echo "対象文字列: " . $subject . PHP_EOL;
24    echo "パターン: " . $pattern . PHP_EOL . PHP_EOL;
25
26    // preg_match関数を実行
27    // $matches 変数には、マッチした結果が配列として格納されます。(参照渡し)
28    // 第一引数: 正規表現パターン
29    // 第二引数: 検索対象の文字列
30    // 第三引数: マッチした結果を格納する配列
31    $result = preg_match($pattern, $subject, $matches);
32
33    // 戻り値に基づいて結果を表示
34    if ($result === 1) {
35        echo "正規表現パターンに合致しました。" . PHP_EOL;
36        echo "マッチした回数 (最初の1回): " . $result . PHP_EOL;
37        echo "マッチした内容($matches配列):" . PHP_EOL;
38        // $matches[0] には、パターン全体にマッチした文字列が格納されます。
39        // $matches[1] 以降には、キャプチャグループにマッチした文字列が格納されます。
40        print_r($matches);
41        echo "--------------------------" . PHP_EOL;
42        echo "年: " . $matches[1] . PHP_EOL;
43        echo "月: " . $matches[2] . PHP_EOL;
44        echo "日: " . $matches[3] . PHP_EOL;
45    } elseif ($result === 0) {
46        echo "正規表現パターンに合致しませんでした。" . PHP_EOL;
47    } else { // $result === false の場合 (正規表現パターンに問題があるなどのエラー)
48        echo "preg_match関数でエラーが発生しました。" . PHP_EOL;
49    }
50
51    echo PHP_EOL . "--- マッチしない場合の例 ---" . PHP_EOL;
52    $subjectNoMatch = "今日の天気は晴れです。";
53    $resultNoMatch = preg_match($pattern, $subjectNoMatch, $matchesNoMatch);
54
55    echo "対象文字列: " . $subjectNoMatch . PHP_EOL;
56    echo "パターン: " . $pattern . PHP_EOL . PHP_EOL;
57
58    if ($resultNoMatch === 1) {
59        echo "正規表現パターンに合致しました。" . PHP_EOL;
60    } elseif ($resultNoMatch === 0) {
61        echo "正規表現パターンに合致しませんでした。" . PHP_EOL;
62    } else {
63        echo "preg_match関数でエラーが発生しました。" . PHP_EOL;
64    }
65}
66
67// 関数の実行
68demonstratePregMatch();

PHPのpreg_match関数は、指定した正規表現パターンが対象の文字列中に存在するかどうかを検索する際に使用されます。この関数は、最初に見つかった合致のみを処理し、それ以降の合致は無視します。

第一引数には検索したい正規表現パターンを、第二引数には検索対象の文字列を指定します。第三引数の$matchesは参照渡しの配列で、パターンに合致した結果が格納されます。具体的には$matches[0]にパターン全体にマッチした部分が、正規表現の括弧()で囲まれた「キャプチャグループ」にマッチした内容は$matches[1]以降に順に格納されます。

関数の戻り値は整数またはfalseです。パターンに合致した場合、つまり検索対象の文字列からパターンに該当する部分が見つかった場合は1を返します。合致しなかった場合、見つからなかった場合は0を返します。正規表現パターンに誤りがあるなど、関数の実行中にエラーが発生した場合はfalseを返します。

サンプルコードでは、"今日は2023-10-26です。"という文字列から日付形式YYYY-MM-DDを抽出しています。/(\d{4})-(\d{2})-(\d{2})/というパターンにより、$matches[0]には"2023-10-26"が、$matches[1]には"2023"(年)、$matches[2]には"10"(月)、$matches[3]には"26"(日)がそれぞれ格納されることが示されています。マッチする部分が見つからない場合は、戻り値が0となり、$matches配列は空になります。

preg_matchは文字列中で最初に見つかったパターンのみを検索します。もし複数のパターンをすべて見つけたい場合は、preg_match_all関数をご利用ください。関数の戻り値は、マッチした場合に1、見つからなかった場合に0、正規表現に誤りがあったり実行に失敗した場合にはfalseとなりますので、===を用いた厳密な比較で結果を判定するようにしてください。第3引数の$matches配列には、$matches[0]に全体のマッチした文字列が、$matches[1]以降には正規表現で括弧(())を使って指定した部分(キャプチャグループ)が格納されます。正規表現のパターンはスラッシュ(/)で囲む必要がありますので、記述ミスにご注意ください。

関連コンテンツ