【PHP8.x】getElementsByTagNameメソッドの使い方
getElementsByTagNameメソッドの使い方について、初心者にもわかりやすく解説します。
基本的な使い方
getElementsByTagNameメソッドは、HTMLまたはXMLドキュメント内で指定されたタグ名を持つすべての要素を取得するメソッドです。このメソッドは、Dom\Documentクラスに属しており、ドキュメント全体の構造を解析し、特定の種類の要素を探し出す際に利用されます。
引数として、検索したい要素のタグ名(例: "div", "a", "p"など)を文字列で指定します。このメソッドを実行すると、指定されたタグ名に一致するすべての要素が順序付けられたリストとして返されます。戻り値はDom\NodeListオブジェクトであり、これは取得した要素の集合を扱います。Dom\NodeListはライブコレクションであるため、ドキュメントツリーに後から追加されたり削除されたりした要素も自動的に反映されます。
取得したDom\NodeListオブジェクトからは、インデックスを使って個々の要素(Dom\Elementオブジェクト)にアクセスしたり、ループ処理で要素を順番に処理したりすることができます。例えば、ウェブページのすべてのリンクタグ(<a>)を取得し、それらのURLを抽出する、といった処理に非常に有効です。
このメソッドは、ドキュメントの構造から特定の情報を効率的に抽出したり、特定の種類の要素に対して一括で操作を行ったりする際に、DOM操作の基本的なツールとして広く活用されます。システムエンジニアを目指す方にとって、WebスクレイピングやXMLデータの解析など、ドキュメントの内容をプログラムで扱う上で不可欠な機能の一つです。
構文(syntax)
1<?php 2$document = new Dom\Document(); 3$document->loadHTML('<html><body><p>Sample Text</p></body></html>'); 4$elements = $document->getElementsByTagName('p'); 5?>
引数(parameters)
string $qualifiedName
- string $qualifiedName: 検索したい要素のタグ名を指定する文字列
戻り値(return)
Dom\NodeList
指定されたタグ名を持つすべての要素を、Dom\NodeList オブジェクトとして返します。このリストには、ドキュメントツリー内で見つかった該当する要素がすべて含まれます。