Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Info
titleПримечание

Существуют правила, которые генерируют тревоги, но не выполняют никаких действий (actions). Такие правила помечены меткой disabled: true.

Примеры правил:

alertexpractionssummary
Low disk free space (logs)

Если свободное место на системном диске становится меньше 20 ГБ, удаляются все серверные логи, в том числе и архивированные, для освобождения пространства:

Expand
titleПосмотреть пример правила...
Code Block
wmi_logical_disk_free_bytes{volume="C:"} / (1024 * 1024) < 20480


ACTION_CLEANUP_LOGS
Очистка директории логов при нехватке места на системном диске
Low disk free space (database)

Если свободное место на диске для базы данных становится меньше 15 ГБ, удаляются все события старше одной недели:

Expand
titleПосмотреть пример правила...
Code Block
wmi_logical_disk_free_bytes{volume="C:"} / 
(1024 * 1024) < 15360
ACTION_CLEANUP_DB

Очистка базы данных Postgres при нехватке места на диске. При этом если свободное место на диске для базы данных становится меньше:

  • 10 ГБ – удаляются все события старше одного дня.
  • 5 ГБ – удаляются все события старше одного часа.
  • 3 ГБ – удаляются все события
archive_no_samples

Правило проверяет, поступают ли новые кадры в архив. Если новые кадры не приходят в архив в течение 5 минут, то перезапускается процесс архива:

Expand
titleПосмотреть пример правила...
Code Block
((changes(ngp_archive_channel_state_change
{ep_name="hosts/SERVER/MultimediaStorage"}[5m]) 
+ ngp_archive_channel_current_state
{ep_name="hosts/SERVER/MultimediaStorage"}
 > 0) unless (changes(ngp_input_sample_counter
{ep_name="hosts/SERVER/MultimediaStorage"}[5m])
 > 0)) 
and ignoring(ep_name) ngp_fps{ep_name="hosts/SERVER/DeviceIpint"}
ACTION_RESTART_NGP_UNIT

Перезапуск службы архива, если в архив не приходят новые кадры

detector_no_sample

Правило отслеживает поступление кадров на детектор. Если новые кадры не поступают на детектор, то перезапускается службы детектора:

Expand
titleПосмотреть пример правила...
Code Block
(absent(ngp_fps{ep_name="hosts/SERVER/AVDetector"}) *

scalar(ngp_fps{ep_name="hosts/SERVER/DeviceIpint"}) *

scalar(changes(ngp_fps
{ep_name="hosts/SERVER/AVDetector"}[3m])) * 
scalar((ngp_service_desired_state
{ep_name="hosts/SERVER/AVDetector"}
 == 0) + 1)) > 0
ACTION_RESTART_NGP_UNIT

Перезапуск службы детектора, если активный детектор не получает новые кадры

statistics_server_unhealthy

Если сервер статистики не обновляет счетчик задач или становится недоступным, службы статистики автоматически перезапускаются:

Expand
titleПосмотреть пример правила...
Code Block
absent(changes(ngp_work_item_counter
{ep_name="hosts/SERVER/StatisticsServer"}[5m]))

or absent(up{job="node.SERVER"})
ACTION_RESTART_NGP_UNIT

Перезапуск службы статистики, если нет событий статистики