【前提】
Accel-Mart Plusでは、監視サービスによる死活監視を行っています。
intra-martのヘルスチェックにてエラーを検知した場合、メールによる通知を行います。
【回答】
「PROBLEM:プロセス監視 ALB-[システムID] APサーバダウン検知」というメールが届いた場合、intra-martのヘルスチェックエラーが検知されています。
intra-martのヘルスチェックでは、フロントにあるALB(ロードバランサー)からAPサーバに対して、ヘルスチェック用jspにアクセスすることでチェックを行っています。
チェック内容としては、各APサーバごとにintra-martの各種サービスの起動確認、および、データベースやストレージの接続確認を行っています。
監視サービスにて、ヘルスチェックエラーを検知する条件は以下のとおりです。
・ヘルスチェックにて、正常値を示すレスポンスコード「200」以外を2回連続で返却された場合
ヘルスチェックの詳細については、以下を確認してください。
■intra-mart Accel Platform セットアップガイド - 11.19. intra-mart Accel Platform のヘルスチェック
https://document.intra-mart.jp/library/iap/public/setup/iap_setup_guide/texts/appendix/health_check.html
intra-martのヘルスチェックエラーを検知した場合、原因を調査し、エラーを解消する必要があります。
以下の方法で調査を行ってください。
1. リソース情報の確認
運用管理機能の「リソース表示」より、事象発生時刻や、
事象発生時点のCPUやメモリの使用率の状況などのリソース情報を確認してください。
運用管理機能の「リソース表示」の操作方法、および、表示仕様については、以下を確認してください。
■Accel-Mart Plus 運用者操作ガイド - 5.7. リソース表示
https://aws.accel-mart.com/am_document/texts/system_operation/resource_display/index.html
入力フォームの「リソース選択」より選択できるリソース種別の詳細については、以下を確認してください。
■Accel-Mart Plus サービス仕様書 - 3.3.1.6. リソース表示
https://aws.accel-mart.com/service_manual/texts/03_specifications/03_system_operations/01_system_operations.html#resource-display
2. 原因調査
事象発生時刻付近の対象のAPサーバのResin JVMログ、iAP のシステムログ、リクエストログ等の内容を確認し、事象が発生する要因と考えられる処理が実行されているか、確認してください。
ログの取得方法・ログ設計などの情報を参照したい場合は、以下の関連FAQを確認してください。
・ログファイルの取得方法を教えてください。
https://cloud.intra-mart.support/hc/ja/articles/16597104254873
3. 原因への対処
原因の判明後は、以下のとおり対応してください。
・ご契約者様にて独自に開発されたアプリケーションが起因であると判断された場合
保守サービスでは対応できません。ご契約者様での対応をお願いします。
・弊社が構築し提供しているOS、ミドルウェア製品、および、弊社Accelシリーズ製品が起因である場合
弊社が構築し提供している範囲が起因と判断され、障害対応が必要な場合は、Accel-Mart Plusサービスサポート窓口へお問い合わせください。
その際は、補足事項に記載しているお問い合わせ情報のほか、弊社が構築し提供している範囲が起因と判断された理由についてもあわせて記載してください。
【補足事項】
死活監視の監視閾値については、以下を確認してください。
■Accel-Mart Plus 設定値リファレンス - 2.8.1. 死活監視
https://aws.accel-mart.com/setting_reference/texts/02_tech_specs/08_monitoring.html#alive-monitoring
※項番3「ホスト数」が当事象に該当します。
「APサーバダウン検知」とは、ヘルスチェックにてエラーを検知したAPサーバの数を表しています。
監視サービスの仕様については、以下を確認してください。
■Accel-Mart Plus サービス仕様書 - 3.3.2.2. 監視サービス
https://aws.accel-mart.com/service_manual/texts/03_specifications/03_system_operations/02_other_operations.html#monitoring-services
当FAQを確認しても事象が解決しない場合は、以下の関連FAQを確認してください。
・FAQを確認しても、問題を解決できませんでした。
https://cloud.intra-mart.support/hc/ja/articles/17995848937241