Page History

...

Для мониторинга состояния системы и анализа производительности доступен веб-интерфейс сервиса самодиагностики.

С помощью сервиса можно:

просматривать системные метрики сервера;
анализировать использование ресурсов (CPU, память);
контролировать работу камер и детекторов;
отслеживать состояние архива;
выполнять запросы к метрикам с использованием языка запросов Prometheus (PromQL).

Метрики могут отображаться:

в табличном виде (текущие значения);
в виде графиков за выбранный период времени.

Доступ к сервису самодиагностики

Для перехода к интерфейсу мониторинга необходимонужно:

Открыть веб-браузер.
В адресной строке ввести: http://127.0.0.1:20040/.
Нажать клавишу Enter.

После этого откроется веб-интерфейс сервиса самодиагностики.

Интерфейс и выполнение запросов

Интерфейс сервиса позволяет просматривать метрики в виде таблицы или графиков. Для выполнения запроса нужно:

...

позволяет выполнять запросы к метрикам и анализировать их значения.

Для выполнения запроса нужно:

Ввести метрику в поле Enter expression.
Image Added
Info
title Примечание
Для просмотра доступных метрик в поле Enter expression нужно нажать на кнопку Image Added → Explore metrics.
При необходимости задать временной диапазон.
Нажать на кнопку Execute.

Поддерживается выполнение сложных запросов с использованием PromQL.

Основные возможности запросов

Основные возможности при выполнении запросов приведены в таблице:

Возможности

Описание

Использование нескольких метрик

В одном запросе можно использовать несколько метрик

Фильтрация по параметрам

Метрики можно фильтровать по параметрам (лейблам) с помощью фигурных скобок.

Пример:

Code Block

language	go

ngp_fps{ep_name=~"hosts/TEST/DeviceIpint.2/SourceEndpoint.video:0:0"}

В этом случае отображаются значения FPS только для указанного источника.

Применение логических и арифметических операторов для поиска аномалий

В запросах можно применять:

арифметические операторы;
логические операторы;
функции Prometheus.

Пример:

Code Block

language	go

ngp_fps < 17

Этот запрос позволяет найти источники, у которых частота кадров ниже 17 FPS. Полный список логических и арифметических операторов указан в официальной документации Prometheus.

Просмотр результатов запроса

Результаты запроса можно просматривать в двух режимах:

Table:
- отображает текущие значения метрик в табличном виде;
- показывает актуальные значения метрик;
- обновляется при изменении временного диапазона.
  Image Added
Graph:
- позволяет строить график изменения метрик во времени;
- можно задать период времени для построения графика;
- определить конечную точку графика;
- задать интервал между точками данных;
- дополнительно можно включить режим накопления, при котором область под графиком закрашивается (переключатели Unstacked/Stacked).
  Image Added

Основные метрики сервиса

Ниже приведены основные метрики, доступные в сервисе самодиагностики.

Метрика

Описание

Метрики состояния сиcтемы

ngp_cpu_total_usage

Загрузка центрального процессора сервера

Метрики архива

ngp_archive_channel_fps

Частота кадров всех камер при записи в архив

ngp_archive_volume_size

Текущий общий размер архива (в байтах)

Метрики камер и видеоаналитики

ngp_fps

Частота кадров всех камер, детекторов и декодеров

ngp_people_count

Последнее зафиксированное количество людей в кадре детектором Детектор подсчета толпы TV

ngp_errors

Количество ошибок в работе детекторов:

Нейротрекер
Нейросчетчик
Детектор заполненности
Детектор позы
Детектор объекта
Детектор остановившегося объекта
Детектор дыма
Детектор огня
Детектор уровня воды с использованием нейросети
Детектор штрихкодов
Мета-детектор
Маска конфиденциальности на основе человека
Трекер объектов (с Нейрофильтром)
Детектор подсчета толпы TV

ngp_skipped_pp

Количество пропущенных кадров детектором Детектор подсчета толпы TV из-за нехватки ресурсов для обработки

Метрики состояния системы

ALERTS_FOR_STATE

Найденные и устранённые неисправности системы. Содержит параметр alertname с типом проблемы.

Code Block

language	go
title	Пример

ALERTS_FOR_STATE{alertname="ipint_is_not_activated",ep_name="hosts/Server1/DeviceIpint.99",instance="127.0.0.1:20108",job="ngp_exporter",ngp_alert="true"}

Расшифровка значений alertname (см. Общие сведения о сервисе самодиагностики) для метрики ALERTS_FOR_STATE:

low_os_memory — недостаточно оперативной памяти.
ipint_is_not_activated — есть связь с камерой, но нет от неё данных.
no_samples_in_detector — отсутствуют события от детектора.
restart_services_when_archive_source_not_activated — не работает запись в архив.
restart_services_when_no_samples_in_archive — частота кадров при записи в архив равна 0.
restart_services_when_no_ping_from_detector_to_archive — нет записи в архив по событию от детектора.
logs_disk_space_is_low / db_disk_space_is_low — недостаточно места на системном диске

...

Количество ошибок в работе детекторов:

Нейротрекер
Нейросчетчик
Детектор заполненности
Детектор позы
Детектор объекта
Детектор остановившегося объекта
Детектор дыма
Детектор огня
Детектор уровня воды с использованием нейросети
Детектор штрихкодов
Мета-детектор
Маска конфиденциальности на основе человека
Трекер объектов (с Нейрофильтром)
Детектор подсчета толпы TV

...

Code Block

language	go
title	Пример. Все метрики, где fps был меньше 17

ngp_fps < 17

...

Code Block

language	go
title	Пример. Значения fps только для указанного источника

ngp_fps{ep_name=~"hosts/TEST/DeviceIpint.2/SourceEndpoint.video:0:0"}

...

Просмотр результатов:

...

Метрики состояния дисков (SMART)

smartctl_device_smart_status

Общий статус состояния диска. Основные значения метрики:

1 – диск находится в исправном состоянии;
0 – диск сообщил о неисправности и уже вышел из строя, либо прогнозирует отказ в течение следующих 24 часов.

В таких случаях рекомендуется проверить:

логи экспортера метрик;
права доступа к устройствам;
корректность работы smartctl.

smartctl_device_attribute

Содержит детальные SMART-атрибуты дисков. Существует несколько типов значений:

raw – фактическое значение атрибута без интерпретации;
thresh – пороговое значение, при превышении которого атрибут считается проблемным. Если значение raw превышает thresh, это указывает на потенциальную неисправность устройства;
value – текущее нормализованное значение атрибута. Обычно находится в диапазоне от 1 до 100 или 1 до 253. Используется для представления состояния устройства в удобной форме;
worst – наихудшее нормализованное значение, зафиксированное за время работы устройства. Используется для анализа ухудшения состояния диска.

Пример интерпретации:

Если идет анализ метрики smartctl_device_attribute, значения атрибутов могут выглядеть так:

raw: 15 (фактическое количество переназначенных секторов);
thresh: 50 (порог, при котором диск считается ненадежным);
value: 55 (текущий нормализованный статус атрибута);
worst: 50 (наихудший зафиксированный статус атрибута).

Использование в мониторинге:

raw: используется для детального анализа и диагностики;
thresh: критически важно для настройки предупреждений;
value и worst: используются для мониторинга состояния устройства

...

Примеры полезных запросов для ОС Windows

...

Page tree

Versions Compared

Old Version 7

New Version Current

Key

Доступ к сервису самодиагностики

Интерфейс и выполнение запросов

Основные возможности запросов

Просмотр результатов запроса

Основные метрики сервиса

Примеры полезных запросов для ОС Windows