You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 7 Next »

На странице:



Общие сведения

Для мониторинга состояния системы и анализа производительности доступен веб-интерфейс сервиса самодиагностики.

Доступ к сервису самодиагностики

Для перехода к интерфейсу мониторинга необходимо:

  1. Открыть веб-браузер.
  2. В адресной строке ввести: http://127.0.0.1:20040/.
  3. Нажать клавишу Enter.

Интерфейс и выполнение запросов

Интерфейс сервиса позволяет просматривать метрики в виде таблицы или графиков. Для выполнения запроса нужно:

  1. Выбрать метрику из выпадающего списка 1 или ввести запрос вручную в поле Expression. Допускается:
    1. Использование нескольких метрик одновременно. В системе доступны следующие основные метрики:
      МетрикаОписание
      ALERTS_FOR_STATE

      Найденные и устранённые неисправности. Содержит параметр alertname с типом проблемы.

      Пример
      ALERTS_FOR_STATE{alertname="ipint_is_not_activated",ep_name="hosts/Server1/DeviceIpint.99",instance="127.0.0.1:20108",job="ngp_exporter",ngp_alert="true"}

      Расшифровка значений alertname (см. Общие сведения о сервисе самодиагностики) для метрики ALERTS_FOR_STATE:

      • low_os_memory — недостаточно оперативной памяти.
      • ipint_is_not_activated — есть связь с камерой, но нет от неё данных.
      • no_samples_in_detector — отсутствуют события от детектора.
      • restart_services_when_archive_source_not_activated — не работает запись в архив.
      • restart_services_when_no_samples_in_archive — частота кадров при записи в архив равна 0.
      • restart_services_when_no_ping_from_detector_to_archive — нет записи в архив по событию от детектора.
      • logs_disk_space_is_low / db_disk_space_is_low — недостаточно места на системном диске
      ngp_archive_channel_fpsЧастота кадров всех камер при записи в архив
      ngp_archive_volume_sizeТекущий общий размер архива (в байтах)
      ngp_cpu_total_usageЗагрузка центрального процессора сервера
      ngp_fpsЧастота кадров со всех камер сервера, детекторов и декодеров
      ngp_people_countПоследнее зафиксированное количество людей в кадре детектором Детектор подсчета толпы TV
      ngp_errors

      Количество ошибок в работе детекторов:

      ngp_skipped_ppКоличество пропущенных кадров детектором Детектор подсчета толпы TV из-за нехватки ресурсов для обработки

    2. Применение логических и арифметических операторов для поиска аномалий. Полный список логических и арифметических операторов указан в официальной документации Prometheus.
      Пример. Все метрики, где fps был меньше 17
      ngp_fps < 17
    3. Фильтрация по параметрам метрик с помощью фигурных скобок.
      Пример. Значения fps только для указанного источника
      ngp_fps{ep_name=~"hosts/TEST/DeviceIpint.2/SourceEndpoint.video:0:0"}


  2. При необходимости задать временной диапазон для данных.
  3. Нажать кнопку Execute.

Просмотр результатов:

  • На вкладке Console отображаются текущие значения метрик в табличном формате.

    При задании даты и времени в календаре данные обновятся.

  • На вкладке Graph строится график выбранных метрик за заданный период.
    • Поле 1 — задаёт временной интервал графика.
    • Поле 2 — определяет конечную точку графика.
    • Поле 3 — устанавливает интервал между точками данных.
    • Флажок 4 — включает режим отображения с накоплением (закрашивание областей под графиком).

Примеры полезных запросов для ОС Windows

  1. График загрузки CPU (аналог Системного монитора):
    sum by (process_id) (100 / scalar(wmi_cs_logical_processors) * (irate(wmi_process_cpu_time_total{process="AppHost"}[10m]))) or ngp_cpu_total_usage
  2. Использование оперативной памяти процессами AppHost и общий объём:
    sum by (process_id) (avg_over_time(wmi_process_working_set{process="AppHost"}[5m])) / 1024 or avg_over_time(wmi_os_virtual_memory_bytes[5m]) / 1024
  3. Процент использования оперативной памяти:
    100.0 - 100 * avg_over_time(wmi_os_virtual_memory_free_bytes[5m]) / avg_over_time(wmi_os_virtual_memory_bytes[5m])

Примеры полезных запросов для ОС Linux

  1. Суммарное использование оперативной памяти процессами AppHost:
    sum by (groupname) (namedprocess_namegroup_memory_bytes{memtype="resident"})
  2. Процент использования оперативной памяти:
    100 - node_memory_MemAvailable_bytes * 100 / node_memory_MemTotal_bytes
  3. График загрузки CPU процессами AppHost %):
    sum by (object_id) (rate(namedprocess_namegroup_cpu_seconds_total{groupname="AppHost"}[1m])) * 100
  4. Общая загрузка CPU (в %):
    100 * avg without (cpu) (1 - rate(node_cpu_seconds_total{mode="idle"}[1m]))
  5. Использование памяти процессами AppHost для выявления утечек:
    namedprocess_namegroup_memory_bytes{object_id=~"APP_HOST.*",memtype="proportionalResident"}
  • No labels