Приложение 4 Сервисы и тесты wiSLA
1. Введение
Обеспечение стабильности и высокой производительности сервисов требует использования различных методов тестирования. В этой документации описаны связи между сервисами и типами тестов, которые применяются для их оценки.
2. Основные типы сервисов и их тестирование
2.1 Сетевые сервисы
Сетевые сервисы включают маршрутизацию, коммутацию, балансировку нагрузки, а также мониторинг сетевого трафика. Их качество и стабильность оцениваются с помощью тестов, таких как:
- Cisco IPSLA – позволяет измерять задержку, джиттер, потери пакетов и другие параметры сети путем эмуляции реального трафика.
- NetFlow – анализирует потоки данных, проходящих через сетевые устройства, выявляя узкие места и потенциальные аномалии.
- SNMP-based тесты – используются для мониторинга состояния сетевых устройств и сбора статистики о их загрузке.
- TWAMP – тест измерения двусторонней задержки и потерь в сетях IP.
2.2 Облачные и веб-сервисы
Облачные платформы и веб-приложения требуют мониторинга доступности, задержек и корректности обработки запросов. Для тестирования таких сервисов используются:
- WiProbe HTTP/TCP/UDP тесты – проверяют доступность веб-приложений и скорость их ответа на запросы пользователей.
- DNS тесты – оценивают время разрешения имен узлов, корректность работы DNS-серверов и возможные задержки в обслуживании запросов.
- WiProbe Scenario Test – позволяет моделировать пользовательские сценарии взаимодействия с облачными сервисами и проверять их работоспособность.
2.3 Голосовые и мультимедийные сервисы
Голосовая связь и видеоконференции требуют высокой стабильности соединения и минимальных потерь данных. Для их тестирования применяются:
- MOS Test – оценивает качество голосовой связи по шкале MOS (Mean Opinion Score).
- WiProbe SIP Test – проверяет корректность установления и удержания SIP-звонков.
- WiProbe Y.1731 – используется для диагностики параметров качества обслуживания (QoS) в IP-сетях, включая потери пакетов и джиттер.
2.4 Системные и аппаратные сервисы
Мониторинг состояния серверов, баз данных и других вычислительных мощностей осуществляется с помощью:
- SNMP-универсальные тесты – отслеживают загрузку CPU, оперативной памяти и дисковой подсистемы серверов.
- Utilization Test – анализирует использование ресурсов, включая дисковое пространство, загрузку процессоров и оперативной памяти.
- HDD SMART Test – проверяет состояние жестких дисков и их производительность.
2.5 Безопасность и контроль доступа
Обеспечение безопасности IT-инфраструктуры требует постоянного мониторинга состояния сетевых узлов и выявления аномальной активности. Для этих задач используются:
- Проверка доступности TCP/UDP портов – помогает выявлять проблемы с доступностью критичных сервисов.
- Анализ входящего и исходящего трафика – фиксирует возможные атаки и несанкционированный доступ.
- WiProbe L7 Test – оценивает работу приложений на уровне прикладных протоколов (HTTP, FTP, SMTP и др.).
3. Описание ключевых показателей качества
3.1 Сетевые показатели
- Задержка (мс) – время, затрачиваемое на передачу данных между двумя точками сети.
- Джиттер (мс) – вариативность задержки передачи пакетов в сети.
- Круговая задержка (мс) – измерение времени полного пути пакета в сети.
- Круговой джиттер (мс) – изменчивость задержки в круговых пакетах.
- Круговые потери пакетов (%) – процент потерянных пакетов при круговом тестировании.
- Пропускная способность (Мбит/с) – максимальная скорость передачи данных по сети.
- Потери пакетов (%) – процент потерянных пакетов при передаче данных.
- Отклик (мс) – время реакции сервиса на запрос пользователя.
3.2 Производительность серверов и системные показатели
- Загрузка процессора (%) – уровень использования вычислительных ресурсов CPU.
- Загрузка оперативной памяти (%) – объем используемой ОЗУ относительно общего объема.
- Свободное место на HDD (Гбайт) – доступный объем хранилища.
- Среднее время чтения с диска (мс) – время, необходимое для выполнения операций чтения с диска.
- Процент загрузки SWAP (%) – использование виртуальной памяти системой.
- Активные процессы (ед) – число запущенных процессов в системе.
- Общий объем трафика (Гбайт) – суммарное количество переданных данных.
- Время регистрации (мс) – время, требуемое для регистрации в системе.
3.3 Надежность сервисов
- Доступность (%) – процент времени, в течение которого сервис был доступен.
- Количество отказов (единицы) – число случаев недоступности или сбоев сервиса.
- Успешность выполнения сценариев (%) – процент корректно завершенных операций в тестируемой среде.
- Ошибки передачи по интерфейсу (ед) – количество зафиксированных ошибок передачи.
3.4 Показатели безопасности
- Изменение конфигурации TOS (%) – процент пакетов с измененным приоритетом передачи.
- Аномальный трафик (единицы) – количество зафиксированных подозрительных активностей.
- Частота отказов соединений (%) – процент разорванных соединений.
- Количество прерываний в секунду (ед) – частота вызовов аппаратных прерываний.
3.5 Дополнительные показатели
- Средняя загрузка системы (мс) – средний уровень нагрузки процессора за 1, 5 и 15 минут.
- Количество открытых файловых дескрипторов (ед) – число открытых файлов в системе.
- Пакеты вне очереди (%) – процент пакетов, обработанных вне стандартной очереди.
- Объем входящего и исходящего трафика (Гбайт) – количество данных, переданных и полученных системой.
4. Выводы
Тестирование сервисов является неотъемлемой частью обеспечения их стабильности и безопасности. Различные типы тестов позволяют отслеживать ключевые метрики, выявлять аномалии и устранять возможные проблемы до их критического влияния на работу инфраструктуры. Выбор конкретного типа теста зависит от особенностей контролируемого сервиса, требуемых метрик и условий эксплуатации системы.