Перейти в хранилище документации
Обратиться в техническую поддержку
Сервис самодиагностики собирает информацию о метриках системы и проверяет работу всех компонентов ПК Интеллект X. Полученные данные сравниваются с показателями нормальной работы системы. При возникновении отклонений генерируются внутренние тревоги, которые можно отследить в web-интерфейсе (см. Просмотр метрик в сервисе самодиагностики).
Примеры отслеживаемых ошибок:
В сервисе самодиагностики реализованы правила, которые позволяют отслеживать различные состояния системы. Полный список правил, доступный для конкретного сервера, можно посмотреть в web-интерфейсе сервиса самодиагностики в разделе Status → Rules: http://127.0.0.1:20040/rules, где:
Примечание
Существуют правила, которые генерируют тревоги, но не выполняют никаких действий (actions). Такие правила помечены меткой disabled: true.
Примеры правил:
alert | expr | actions | summary |
---|---|---|---|
Low disk free space (logs) | Если свободное место на системном диске становится меньше 20 ГБ, удаляются все серверные логи, в том числе и архивированные, для освобождения пространства: | ACTION_CLEANUP_LOGS | Очистка директории логов при нехватке места на системном диске |
Low disk free space (database) | Если свободное место на диске для базы данных становится меньше 15 ГБ, удаляются все события старше одной недели: | ACTION_CLEANUP_DB | Очистка базы данных Postgres при нехватке места на диске. При этом если свободное место на диске для базы данных становится меньше:
|
archive_no_samples | Правило проверяет, поступают ли новые кадры в архив. Если новые кадры не приходят в архив в течение 5 минут, то перезапускается процесс архива: | ACTION_RESTART_NGP_UNIT | Перезапуск службы архива, если в архив не приходят новые кадры |
detector_no_sample | Правило отслеживает поступление кадров на детектор. Если новые кадры не поступают на детектор, то перезапускается службы детектора: | ACTION_RESTART_NGP_UNIT | Перезапуск службы детектора, если активный детектор не получает новые кадры |
statistics_server_unhealthy | Если сервер статистики не обновляет счетчик задач или становится недоступным, службы статистики автоматически перезапускаются: | ACTION_RESTART_NGP_UNIT | Перезапуск службы статистики, если нет событий статистики |