...
Результаты запроса можно просматривать в двух режимах.:
- Table:
отображает текущие значения метрик в табличном виде;
показывает актуальные значения метрик;
обновляется при изменении временного диапазона.

- Graph:
...
| Метрика | Описание |
|---|
| Метрики состояния ситемы |
| ngp_cpu_total_usage | Загрузка центрального процессора сервера |
| Метрики архива |
| ngp_archive_channel_fps | Частота кадров всех камер при записи в архив |
| ngp_archive_volume_size | Текущий общий размер архива (в байтах) |
| Метрики камер и видеоаналитики |
| ngp_fps | Частота кадров всех камер, детекторов и декодеров |
| ngp_people_count | Последнее зафиксированное количество людей в кадре детектором Детектор подсчета толпы TV |
| ngp_errors | Количество ошибок в работе детекторов: |
| ngp_skipped_pp | Количество пропущенных кадров детектором Детектор подсчета толпы TV из-за нехватки ресурсов для обработки |
| Метрики состояния системы |
| ALERTS_FOR_STATE | Найденные и устранённые неисправности системы. Содержит параметр alertname с типом проблемы.| Code Block |
|---|
| ALERTS_FOR_STATE{alertname="ipint_is_not_activated",ep_name="hosts/Server1/DeviceIpint.99",instance="127.0.0.1:20108",job="ngp_exporter",ngp_alert="true"} |
Расшифровка значений alertname (см. Общие сведения о сервисе самодиагностики) для метрики ALERTS_FOR_STATE: - low_os_memory — недостаточно оперативной памяти.
- ipint_is_not_activated — есть связь с камерой, но нет от неё данных.
- no_samples_in_detector — отсутствуют события от детектора.
- restart_services_when_archive_source_not_activated — не работает запись в архив.
- restart_services_when_no_samples_in_archive — частота кадров при записи в архив равна 0.
- restart_services_when_no_ping_from_detector_to_archive — нет записи в архив по событию от детектора.
- logs_disk_space_is_low / db_disk_space_is_low — недостаточно места на системном диске
|
| Метрики состояния дисков (SMART) |
| smartctl_device_smart_status | Общий статус состояния диска. Основные значения метрики: - 1 – диск находится в исправном состоянии;
- 0 – диск сообщил о неисправности и уже вышел из строя, либо прогнозирует отказ в течение следующих 24 часов.
В таких случаях рекомендуется проверить: - логи экспортера метрик;
- права доступа к устройствам;
- корректность работы smartctl.
|
| smartctl_device_attribute | Содержит детальные SMART-атрибуты дисков. Существует несколько типов значений: - raw – фактическое значение атрибута без интерпретации;
- thresh – пороговое значение, при превышении которого атрибут считается проблемным. Если значение raw превышает thresh, это указывает на потенциальную неисправность устройства;
- value – текущее нормализованное значение атрибута. Обычно находится в диапазоне от 1 до 100 или 1 до 253. Используется для представления состояния устройства в удобной форме;
- worst – наихудшее нормализованное значение, зафиксированное за время работы устройства. Используется для анализа ухудшения состояния диска.
Пример интерпретации: Если идет анализ метрики smartctl_device_attribute, значения атрибутов могут выглядеть так: - raw: 15 (фактическое количество переназначенных секторов);
- thresh: 50 (порог, при котором диск считается ненадежным);
- value: 55 (текущий нормализованный статус атрибута);
- worst: 50 (наихудший зафиксированный статус атрибута).
Использование в мониторинге: - raw: используется для детального анализа и диагностики;
- thresh: критически важно для настройки предупреждений;
- value и worst: используются для мониторинга состояния устройства
|
...