死活監視 (シカツカンシ) とは | 意味や読み方など丁寧でわかりやすい用語解説

作成日: 更新日:

死活監視 (シカツカンシ) の読み方

日本語表記

死活監視 (シカツカンシ)

英語表記

liveness monitoring (ライブネスモニタリング)

死活監視 (シカツカンシ) の意味や用語解説

死活監視とは、情報システムやその構成要素が正常に稼働しているか否かを定期的に確認する仕組みである。これは、システムが「生きている」か「死んでいる」かを監視するという意味合いを持つ。システムの安定稼働を維持し、万が一の障害発生時にそれを早期に検知するために不可欠なプロセスだ。例えば、ウェブサイトが利用できなくなったり、データベースが応答しなくなったりといった事態は、ユーザー体験の低下やビジネス損失に直結する。死活監視は、そのような最悪の事態を未然に防ぎ、あるいは迅速に対処するための第一歩となる重要な運用手法である。 死活監視の基本的な仕組みは、監視対象に対して定期的に何らかの問い合わせを行い、その応答をチェックすることによって成り立っている。監視ツールは、あらかじめ設定された間隔で監視対象に信号を送信し、監視対象からの応答が返ってくるか、あるいはその応答の内容が期待通りであるかを確認する。応答がなかったり、応答内容が異常であったりする場合、それは監視対象が正常に機能していない、つまり「死んでいる」状態と判断される。この判断基準は、単に応答の有無だけでなく、応答時間や応答内容の詳細によっても決定される。 監視の対象は多岐にわたる。最も一般的なのは、サーバー本体やネットワーク機器の稼働状況だ。これに加え、その上で動作するアプリケーション、ウェブサーバー、データベースサーバー、各種ミドルウェア、さらには特定のサービスを提供するプロセスなども監視対象となる。それぞれの監視対象や目的、必要な監視レベルに応じて、適した監視方法が用いられる。 代表的な死活監視の方法として、まずPing監視が挙げられる。これは、IPネットワーク層での疎通確認を行う最も基本的な方法だ。監視元から監視対象のIPアドレスに対してICMP(Internet Control Message Protocol)エコーリクエストを送信し、エコー応答が返ってくるかどうかを確認する。応答があれば、監視元と監視対象の間でネットワーク的な接続は問題ないと判断できる。ただし、Pingに応答しないように設定されているサーバーも存在するため、Ping応答だけで完全な死活判断はできない点に留意が必要だ。 次に、ポート監視がある。これは、特定のサーバーやアプリケーションが使用するTCP/UDPポートに対して接続を試み、そのポートが開いているか、あるいは接続に成功するかを確認する方法だ。例えば、ウェブサーバーの死活監視であればHTTP(80番ポート)やHTTPS(443番ポート)への接続を試み、データベースサーバーであればそのデータベースが使用するポートへの接続を試みる。これにより、サーバー自体は稼働していても、特定のサービスを司るプロセスが停止しているといった、よりサービスレベルに近い異常を検知できる。 さらに高度な監視として、プロセス監視がある。これは、サーバー上で特定のアプリケーションプロセスやシステムプロセスが動作しているかどうかを直接確認する方法だ。アプリケーションが異常終了していても、OSレベルでのサーバー自体は稼働を続けているケースがある。プロセス監視は、特定のサービスが実際に機能しているかを把握する上で重要な役割を果たす。 ウェブサービスにおいては、URL監視やHTTP監視が一般的だ。これは、特定のURLにHTTPリクエストを送信し、その応答コード(例:200 OK、404 Not Found、500 Internal Server Errorなど)や応答内容、応答時間を確認する方法である。単にサーバーが稼働しているだけでなく、ウェブアプリケーション自体が正常に動作し、期待されるコンテンツをユーザーに提供できているかを判断できるため、ユーザー視点での死活監視と言える。応答コードがエラーを示したり、期待される文字列がページ内に存在しなかったりする場合も、異常と判断される。 死活監視は、単に「生きているか死んでいるか」を判断するだけでなく、その状態の変化を検知した際の通知機能と連動することで真価を発揮する。監視ツールは、異常を検知すると、あらかじめ設定された閾値(例:5分間応答がない、HTTP応答コードが500番台を返した、応答時間が指定された値を超過したなど)に基づいて、担当者へメール、SNMPトラップ、チャットツール、SMSなど様々な方法でアラートを通知する。これにより、システム管理者は障害の発生を早期に察知し、迅速な対応を開始できる。早期発見は、障害による影響範囲の拡大を防ぎ、復旧時間を短縮する上で極めて重要である。 さらに進んだ運用では、死活監視の検知結果に基づいて自動的な復旧処理を行う仕組みが構築されることもある。例えば、特定のサービスプロセスが停止していることを検知した場合、そのプロセスを自動的に再起動するスクリプトを実行するといった対応が可能だ。また、システム全体が停止している場合は、別の待機系サーバーに処理を切り替えるフェイルオーバー処理を自動的に実行することもある。これにより、軽微な障害であれば人間の介入なしにシステムを正常な状態に戻し、運用負荷を軽減できるとともに、サービスの可用性を一層高めることができる。 死活監視は、システムの信頼性を確保し、ユーザーへの安定したサービス提供を維持するために不可欠な運用プロセスである。障害発生時の影響を最小限に抑え、システムの可用性を高める上で、その重要性は極めて高いと言える。システム運用における基本的な要素であり、どのような規模のITシステムにおいても必ず実施されるべき基盤的な対策である。

死活監視 (シカツカンシ) とは | 意味や読み方など丁寧でわかりやすい用語解説