Zabbix 5: сущность и принципы применения

Иван Худорожков, старший системный инженер Logrocon. Рассматриваемые вопросы: 1. Архитектура Zabbix системы. 2. Основные возможности: Проверки, Триггеры, Действия, Операции, Шаблоны. 3. Низкоуровневое обнаружение. 4. Zabbix за прокси. 5. Веб-интерфейс. 6. Лучшие практики. Краткое содержание: 1) Что такое Zabbix? Zabbix — это универсальный инструмент мониторинга, способный отслеживать динамику работы серверов и сетевого оборудования, быстро реагировать на внештатные ситуации и предупреждать возможные проблемы с нагрузкой. Система мониторинга Zabbix может собирать статистику в указанной рабочей среде и действовать в определенных случаях заданным образом. Систему создал Алексей Владышев на языке Perl. Впоследствии проект подвергся серьезным изменением, которые затронули и архитектуру. Zabbix переписали на C и PHP. Открытый исходный код появился в 2001 г., а уже через три года выпустили первую стабильную версию. Веб-интерфейс Zabbix написан на PHP. Для хранения данных используются MySQL, Oracle, PostgreSQL, SQLite или IBM DB2. 2) Архитектура Zabbix. 1. Сервер. 2. Прокси. 3. Агент. 4. Веб-интерфейс. 3) Схема Zabbix 5. 4) Основные возможности. Функционал включает в себя общие проверки для наиболее распространенных сервисов, в том числе СУБД, SSH, Telnet, VMware, NTP, POP, SMTP, FTP и т.д. Если стандартных настроек системы недостаточно, их можно изменить самостоятельно или же пользоваться дополнением через API. Стандартные функции системы: 1. Контроль нагрузки на процессор, касается и отдельных процессов. 2. Сбор данных об объеме свободной оперативной и физической памяти. 3. Пинг для проверки доступности узлов в сети. 4. Мониторинг активности жесткого диска. 5. Мониторинг сетевой активности. 5) Проверки. Для описания системы мониторинга Zabbix существует два ключевых понятия: 1. Узлы сети. 2. Элементы данных. 6) Агент проверок. 7) Проверки. Zabbix agent (Zabbix-агент). Simple check (Простые проверки). Zabbix trapper (Zabbix-траппер). Zabbix aggregate (Zabbix-комплекс). SSH agent (SSH-агент). Calculate (Вычисление). 8) Проверки через пользовательский параметр UserParameter. 9) Тригеры. Не классифицировано (Not classified) — серый. Информация (Information) — светло-синий. Предупреждение (Warning) — жёлтый. Средняя (Average) — оранжевый. Высокая (High) — светло-красный. Чрезвычайная (Disaster) — красный. avg — среднее значение за определенный интервал в секундах или количество отсчетов. Delta — разность между максимумом и минимумом с определенным интервалом или количеством отсчетов. change — разница между последним и предпоследним значением. count — количество отсчетов, удовлетворяющих критерию. date — дата. dayofweek — день недели от 1 до 7. diff — у параметра есть значения, где 0 — последнее и предпоследнее значения равны, 1 — различаются. last — любое (с конца) значение элемента данных. max\min — максимум и минимум значений за указанные интервалы или отсчеты. now — время в формате UNIX. prev — предпоследнее значение. sum — сумма значений за указанный интервал или количество отсчетов. time — текущее время в формате HHMMSS. 10) Действие. Действие (Action) - представляет собой заданную реакцию на событие (Event). Name — имя действия. Event source — источник события. Источниками событий служат обнаружение (Discovery Events), авторегистрация (Auto registration Events) или заданный триггер (Trigger Events). Enable escalations — разрешение на эскалацию событий. Period — период времени для шага эскалации, указывается в секундах. Default subject — указывается, кто извещается по умолчанию. Default message — стандартный текст сообщения. Recovery message — текст уведомления после решения проблемы. Recovery subject — субъект, которого извещают после операции. Status — статус действия, может быть «активно» и «запрещено». 11) Параметры операций. Step — при эскалации событий. Operation type — действия на определенном шаге, например, «Send message» или «Execute command». Event Source — источник событий. Send message to — отдельное сообщение (Single user) или групповое (User group). Default message — текст по умолчанию. Subject — кого оповещает система. Message — текст сообщения. Remote command — команда для удаленного управления. 12) Операции. 13) Шаблоны. 1. Стандартизованные шаблоны для сетевых устройств 2. Настройка шаблонов HTTP 3. Настройка шаблонов IPMI 4. Настройка шаблонов ODBC 14) Низкоуровневое обнаружение. 1. Распространённые OID, используемые SNMP. 2. Сетевые интерфейсы. 3. Процессоры, их ядра. 4. Файловые системы. 5. Службы Windows. 6. ODBC. 15) Дополнительные типы. SSH, LDAP, SMTP, FTP, HTTP, POP, NNTP, IMAP, TCP 16) Прокси. 17) Особенности веб-ин
Back to Top