Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Section
Column
width45%50%
Panel
titleНа странице:

Table of Contents

Column

...



Общие сведения

Для просмотра данных о состоянии системы необходимо:мониторинга состояния системы и анализа производительности доступен веб-интерфейс сервиса самодиагностики.

Доступ к сервису самодиагностики

Для перехода к интерфейсу мониторинга необходимо:

  1. Открыть веб-браузер.
  2. В адресной строке ввести
  3. Перейти в web-интерфейс сервиса самодиагностики
  4. : http://127.0.0.1:20040/.
  5. Image Removed
  6. Нажать клавишу Enter.

Интерфейс и выполнение запросов

Интерфейс сервиса позволяет просматривать метрики в виде таблицы или графиков. Для выполнения запроса нужно:

  1. Выбрать
  2. необходимую метрику в списке (1)
  3. метрику из выпадающего списка 1 или ввести запрос
  4. самостоятельно
  5. вручную в поле Expression. Допускается:
    1. Использование нескольких метрик одновременно. В системе доступны следующие основные метрики:
      МетрикаОписание
      ALERTS_FOR_STATE

      Найденные и

  6. устраненные неисправности сервисом самодиагностики
    1. устранённые неисправности. Содержит параметр alertname с типом проблемы.

      Code Block
      languagego
      titleПример
      ALERTS_FOR_STATE{alertname="ipint_is_not_activated",ep_name="hosts/Server1/DeviceIpint.99",instance="127.0.0.1:20108",job="ngp_exporter",ngp_alert="true"}
  7. Возможные значения 
    1. Расшифровка значений alertname (см. Общие сведения о сервисе самодиагностики) для метрики ALERTS_FOR_STATE:

      • low_os_memory
      • недостаточно оперативной памяти
  8. ;
      • .
      • ipint_is_not_activated
      • есть связь с
  9. видеокамерой
      • камерой, но нет от неё данных
  10. от нее;
      • .
      • no_samples_in_detector
  11. – нет событий
      • — отсутствуют события от детектора
  12. ;
      • .
      • restart_services_when_archive_source_not_activated
  13.  – архив
      • не работает
  14. ;
      • запись в архив.
      • restart_services_when_no_samples_in_archive
      • частота кадров при записи в архив равна 0
  15. ;
      • .
      • restart_services_when_no_ping_from_detector_to_archive
      • нет записи в архив по событию от детектора
  16. ;
      • .
      • logs_disk_space_is_low /
  17.  
      • db_disk_space_is_low
  18. – закончилось место
      • — недостаточно места на системном диске
  19. .
      ngp_archive_channel_fpsЧастота кадров всех
  20. видеокамер на запись
    1. камер при записи в архив
      ngp_archive_volume_sizeТекущий общий размер архива (в байтах)
      ngp_cpu_total_usageЗагрузка
  21. ЦП
    1. центрального процессора сервера
      ngp_fpsЧастота кадров со всех
  22. видеокамер Сервера
    1. камер сервера,
  23. всех
    1. детекторов и
  24. их декодеров

    В запросе допускается:

  25. Использование нескольких метрик.
  26. Использование выражений для поиска проблем. Например, запрос вида ngp_fps < 17 выдаст все метрики, где fps был меньше 17.
    1. декодеров
      ngp_people_countПоследнее зафиксированное количество людей в кадре детектором Детектор подсчета толпы TV
      ngp_errors

      Количество ошибок в работе детекторов:

      ngp_skipped_ppКоличество пропущенных кадров детектором Детектор подсчета толпы TV из-за нехватки ресурсов для обработки

    2. Применение логических и арифметических операторов для поиска аномалий. Полный список логических и арифметических операторов указан в официальной документации Prometheus.

    1. Code Block
      languagego
      titleПример. Все метрики, где fps был меньше 17
      ngp_fps < 17
    2. Фильтрация по параметрам метрик с помощью фигурных скобок.
      Code Block
      languagego
      titleПример. Значения
  27. Фильтрация по любому из параметров. Например,  данный запрос выдаст значения
    1. fps только для указанного источника
  28. :code
    1. ngp_fps{ep_name=~"hosts/TEST/DeviceIpint.2/SourceEndpoint.video:0:0"}
  29. Нажать на кнопку Execute (2).

...

    1. Image Added

  1. При необходимости задать временной диапазон для данных.
  2. Нажать кнопку Execute.

Просмотр результатов:

  • На вкладке Console отображаются текущие значения метрик в табличном формате.
    Image Modified
    При задании даты и времени в календаре данные обновятся.
    Image Modified

...

  • На вкладке Graph строится график выбранных метрик за заданный период.
    • Поле 1 — задаёт временной интервал графика.
    • Поле 2 — определяет конечную точку графика.
    • Поле 3 — устанавливает интервал между точками данных.
    • Флажок 4 — включает режим отображения с накоплением (закрашивание областей под графиком).
      Image Modified

Примеры полезных запросов для ОС Windows

  1. График загрузки CPU по аналогии с Системным монитором Windows(аналог Системного монитора):
    Code Block
    languagego
    sum by (process_id) (100 / scalar(wmi_cs_logical_processors) * (irate(wmi_process_cpu_time_total{process="AppHost"}[10m]))) or ngp_cpu_total_usage
  2. График использования Использование оперативной памяти процессами AppHost и общий объем памятиобъём:
    Code Block
    languagego
    sum by (process_id) (avg_over_time(wmi_process_working_set{process="AppHost"}[5m])) / 1024 or avg_over_time(wmi_os_virtual_memory_bytes[5m]) / 1024
  3. Процент использования оперативной памяти:
    Code Block
    languagego
    100.0 - 100 * avg_over_time(wmi_os_virtual_memory_free_bytes[5m]) / avg_over_time(wmi_os_virtual_memory_bytes[5m])

Примеры полезных запросов для ОС Linux

  1. График суммарного использования Суммарное использование оперативной памяти процессами AppHost:
    Code Block
    languagego
    sum by (groupname) (namedprocess_namegroup_memory_bytes{memtype="resident"})
  2. Процент использования оперативной памяти:
    Code Block
    languagego
    100 - node_memory_MemAvailable_bytes * 100 / node_memory_MemTotal_bytes
  3. График загрузки CPU процессами AppHost (в процентах %):
    Code Block
    languagego
    sum by (object_id) (rate(namedprocess_namegroup_cpu_seconds_total{groupname="AppHost"}[1m])) * 100
    График загрузки
  4. Общая загрузка CPU (в процентах %):
    Code Block
    languagego
    100 * avg without (cpu) (1 - rate(node_cpu_seconds_total{mode="idle"}[1m]))
  5. График использования оперативной Использование памяти процессами AppHost для определения утечки памятивыявления утечек:
    Code Block
    languagego
    namedprocess_namegroup_memory_bytes{object_id=~"APP_HOST.*",memtype="proportionalResident"}