Метрики мониторинга

Метрики мониторинга#

ПМ собирает метрики во всех подсистемах платформы AIC и выводит информацию в дашборды. Основные метрики, которые собирает и анализирует ПМ приведены ниже:

  1. Метрики ALSE.

  2. Метрики Подсистемы виртуализации:

  • количество запущенных ВМ в кластере/зоне;

  • общее ЦПУ / использованное ЦПУ в кластере/ВМ;

  • общая память / используемая память в кластере/ВМ;

  • суммарные статус всех сервисов на хостах в кластере;

  • суммарный статус всех сервисов на fronts в кластере;

  • статус хоста;

  • сетевой трафик и скорость трафика через сетевые интерфейсы;

  • статус сервисов на выбранном хосте.

  1. Мониторинг Подсистемы контроллера домена:

  • использование ЦПУ / памяти службами ПРК;

  • проверка служб:

    • Chrony;

    • Apache2;

    • Cups;

    • Zabbix;

    • Salt-master;

    • krb5kdc;

    • ipa-custodia;

    • dirsrv;

  • проверка синхронизации времени;

  • проверка работы DNS.

  1. Мониторинг FreeIPA:

  • количество неуспешных попыток авторизации в LDAP;

  • количество заблокированных пользователей;

  • статус служб FreeIPA;

  • использование памяти;

  • нагрузка на процессор на контроллерах;

  • количество событий уровня error во всех логах системы за единицу времени;

  • количество Search запросов на контроллере домена;

  • количество логинов в web ui от пользователей с админ правами за единицу времени.

  1. Мониторинг Подсистемы резервного копирования:

  • использование ЦПУ / памяти службами ПРК;

  • проверка бэкапных тасок и их статусов;

  • проверка служб:

    • rubackup_server;

    • rubackup_client;

    • postgresql@11-main.