ネットワークカメラ推進会

Network camera promotion and communication

障害時にログを取得する重要性

ログ収集の重要性

 ネットワークカメラで障害が発生した場合、ログを収集することは極めて重要である。例えば、カメラの映像が映らないという問題が発生した場合、その状況をヒアリングしただけでは、原因がどこにあるのか突き止めることは非常に難しい。

 

 例えば、カメラ本体やレコーダーの故障など、明らかなハードウェアの故障の場合、原因の切り分けはそれほど難しくはない。解決方法は、機器交換または修理すればよい。一方、ネットワークカメラでは、通信の一時的な不良やシステムのフリーズなど、その原因が分かりにくいケースも少なくない。

 

 ユーザーは「カメラの映像が映らない!今すぐなんとかしてくれ!」と怒鳴ってくることもあるかもしれない。しかし、どのような場合も技術者は落ち着いて、その原因を分析するためのログを収集し、解決に努めることが重要である。

 

 なお、暫定的な解決を優先するのか、または根本的な原因を分析するためのログ収集を優先するのかについては、現場での適切な判断が必要となる。ネットワークカメラ本体やPoE HUBは、再起動するとログも含めて削除・更新されてしまうことがある。

 

 システムの早期復旧が必要な場合は、まずは再起動を試してみるのも1つの手段である。ほとんどのトラブルは、システムの再起動を行うことでシステム内に溜まったゴミがリフレッシュされ、解決するケースも多い。早期復旧を目指す場合は、ログ収集よりも再起動を優先するケースもある。しかしながら、同様の不具合が頻繁に発生する場合は、やはりログ収集を行い、根本的な原因を特定することが重要である。

 

どの機器のログを取得すべきか?

 例えば以下のシステム構成をご覧いただきたい。ここでカメラAとBについて、時々、映像がうまく表示できないトラブルが発生したとする。以下のシステム構成の場合、どの機器のログを取得することが適切であろうか?

  f:id:networkcamera:20190202225244j:plain

  まず、原則としては「システム内のすべての機器のログを収集すること」が望ましい。今回、たまたまカメラAとBの障害が発生していただけで、実はカメラCとDにも同様の障害が起きていた可能性もあるからだ。技術者は出来る限り、システム内の機器すべてのログ収集を行うことが理想だ。

 一方で、ログ収集には時間がかかることもある。または、障害が発生し続けている場合、限られた時間内で効率的にログ収集を行う必要がある。

  今回、カメラAとBの両方に障害が起きていることから、最も怪しいのは「スイッチA」である。もし、スイッチAに何らかの問題がある場合、カメラAとBの両方が同時に障害が起きるということが理論上、説明できるからだ。余力があれば、カメラAとBはもちろん、スイッチCおよびレコーダーと閲覧PCのログも収集しておくと良いだろう。

 

 対応方法としてマズイのは、ひたすらレコーダーのログ収集ばかりするケースだ。もちろん、レコーダーの不具合を疑うことは重要であるが、レコーダーのログを収集しただけでは、根本的な原因にはたどり着けないこともある。

 例えば、レコーダーのログデータに「カメラAとカメラBで接続エラーが発生していた」という履歴が残っていたとする。この場合、レコーダー本体の不具合はもちろん、スイッチの通信不良が原因である可能性もあるため、レコーダーのログを見ただけではネットワーク上でどのような問題が起きているのかは、推測することはできても、その原因を断定することはできないのだ。

 

想定される原因 

 想定される原因としては主に以下などがあるが、この中で可能性が高いものを推測し、優先順位を付けて原因を切り分ける必要がある。

 

①カメラAとBの本体の故障

 →カメラAとBが同時に故障しているケースである。なかなか2台同時に故障するのは珍しいかもしれないが、実際にそのようなケースもある。

 

②スイッチAの故障

 →筆者が最も疑いたいのは、上述の通り、スイッチAの故障である。スイッチAについて、PoEの電源供給能力の不足やハードウェア故障が発生していた場合、カメラAとBの両方が同時に見えなくなるためだ。

 

③スイッチCの故障

 →スイッチAだけではなく、スイッチCの故障の可能性もある。実際に筆者も経験があるが、スイッチで特定のポート(差し込み口やLANケーブルのコネクタ)だけ通信不良が発生していたケースがあった。スイッチCを見ても、パッと見では健康状態にあるように見えるため、原因の特定に非常に時間がかかった。

 

④レコーダーや閲覧用PCの処理能力の不足

 →レコーダーや閲覧用PCのCPUやメモリの処理能力が不足することにより、カメラAとBが見えなくなるケースもある。導入時は何も問題が起きていなくても、経年劣化やホコリなどが溜まることで処理能力が結果として落ちてしまうケースがある。

 

 

 このようにネットワークカメラシステムでは、様々な機器の組み合わせにより構成されるため、障害対応はなかなか困難な側面もある。技術者は、冷静に原因の分析を進めて欲しい。次回の記事では、AXISのカメラのログ収集方法について説明する。