1. ОБЗОР ПЛАТФОРМЫ
Назначение системы.
Задачи, решаемые системой.
Решения на базе платформы wiSLA.
Архитектура и состав платформы wiSLA.
- Назначение системы
- Задачи, решаемые системой
- Решения на базе платформы wiSLA
- Архитектура и состав платформы wiSLA
Назначение системы
ПАК wiSLA (well integrated SLA) — это новое поколение платформы автоматизации и обеспечения качества услуг связи, сервисов ИТ и информационных систем, на основании которой реализована линейка целевых решений для операторов связи, государственных учреждений и крупного корпоративного сегмента.
Программно-аппаратная платформа wiSLA позволяет урегулировать конфликты между поставщиками и потребителями услуг связи на основе мониторинга и управления процессами обеспечения качества в рамках жизненного цикла услуги (PLM).
В основу платформы wiSLA заложена следующая идеология:
- управление конфликтами (Conflict Management) — решения на базе платформы wiSLA являются пограничными и предоставляют информацию, как провайдеру услуги, так и ее потребителю;
- мониторинг качества сервисов (Service Quality Management — SQM) — проактивный мониторинг позволяет оперативно реагировать на случаи ухудшения качества контролируемых услуг и быстро локализовать проблему;
- управление соглашением об уровне обслуживания (Service Level Management — SLA/SLM) — платформа обеспечивает формирование периодических детальных отчётов SLA для анализа соответствия уровня услуг ожиданиям клиента и расчета компенсаций за его нарушение;
- управление восприятием пользователей (Customer Experience Management — CEM) — в платформу заложена гибкая модель формирования цепочки показателей KPI-KQI, которая позволяет формировать агрегированные верхнеуровневые секторальные отчёты о качестве услуг.
Задачи, решаемые системой
1. Мониторинг качества L2/L3 VPN и услуг широкополосного доступа в Интернет
Одной из основных задач, решаемых с помощью платформы wiSLA, является мониторинг и управление качеством VPN L2/L3 уровня и услуг широкополосного доступа в Интернет. Мониторинг осуществляется проактивно, путем активного измерения ключевых параметров качества услуги (процент потери пакетов, задержка передачи пакета, джиттер) с применением аппаратных зондов (wiProbe) или встроенных в сетевое оборудование механизмов оценки качества IP-соединения (например, Cisco IP SLA). Данные измерений собираются на центральный сервер и анализируются на соответствие пороговым значениям, определенным в требованиях SLA к качеству контролируемой услуги. Результаты отображаются на порталах платформы в виде графиков и диаграмм.
2. Аудит соответствия качества услуги параметрам SLA
Платформа wiSLA позволяет формировать периодические отчёты SLA в привязке к биллинговым циклам поставщика услуги. Отчёты формируются по заранее согласованным и определенным SLA правилам: набор показателей качества услуги, правила определения нарушений и расчета верхнеуровневых показателей качества (готовность, скидка). Платформа позволяет контролировать весь процесс SLA от согласования набора показателей и их пороговых значений до учета версий контракта и его изменений, исключения согласованных нарушений из отчёта и расчета размера компенсаций за итоговое нарушение уровня обслуживания согласно SLA. Сформированный отчёт SLA доступен как поставщику услуги, так и клиенту, что позволяет им урегулировать возникающие спорные ситуации на основе единых релевантных данных.
3. Мониторинг доступности и производительности сервисов L7 и приложений (Application Performance Management)
Мониторинг доступности и производительности корпоративных облачных информационных систем (CRM, Order Management, Trouble Ticketing, базы данных и т.д.) — одна из центральных задач wiSLA. Платформа позволяет не только контролировать доступность информационных систем из каждой точки доступа (магистральные узлы сети интернет, офисы конечных пользователей), но и осуществляет глубокий мониторинг программной и аппаратной части инфраструктуры (сервера, виртуальной машины), что обеспечивает разграничение ответственности между каналом связи до ЦОД, неисправностью сервера и проблемами с самим корпоративным приложением.
wiSLA 5.1 обеспечивает многоуровневый мониторинг пользовательских сервисов L7 (WEB-порталы, базы данных, WEB-сервисы (REST, SOAP и т.д.) путем имитации действий реальных пользователей (авторизация на портале, введение и анализ поисковых запросов, выполнение SQL-транзакций и т.д.).
Решения на базе платформы wiSLA
1. Для операторов связи
1.1 Мониторинг L2/L3 VPN
SLA на предоставляемые услуги в последнее время становится обязательным требованием потребителей из крупного корпоративного сегмента и госсектора при выборе оператора связи. Платформа wiSLA предоставляет универсальное решение по обеспечению высокого качества услуг и управлению ожиданиями клиентов.
Решение wiSLA.Telco для операторов обеспечивает:
- разграничение зоны ответственности с потребителем поставляемых услуг и партнерами за счет установки аппаратных зондов «в разрыв» соединения, что позволяет значительно повысить оперативность локализации неисправности и однозначно определить ответственного;
- мониторинг качества клиентских услуг в режиме реального времени позволяет оперативно реагировать на случаи ухудшения качества контролируемой услуги, предвосхищать ее полный отказ и прогнозировать качество передачи пользовательского трафика;
- оперативное оповещение об ухудшении качества/полном отказе услуги средствами электронной почты и sms-рассылки, а также всплывающих уведомлений на портале клиента и мобильном приложении wiSLA позволяют снизить нагрузку на Help-Desk, оперативно уведомлять клиента о причинах и принимаемых мерах для восстановления сервиса;
- формирование периодических отчётов SLA на основе релевантных данных, доступных как оператору, так и клиенту через портал самообслуживания, обеспечивает значительное снижение количества случаев конфликтов во взаимоотношениях с клиентом и повышает его лояльность;
учет загрузки клиентского порта обеспечивает формирование автоматических исключений нарушений из отчёта SLA в случае, если эти нарушения были вызваны превышением допустимой загрузки, при которой SLA гарантировать невозможно; - контроль партнерских сервисов позволяет минимизировать риски невыполнения SLA за счет низкого качества арендованного у партнера канала, который является частью клиентского включения;
- повышение качества внутренних сервисов за счет механизмов проведения нагрузочных испытаний качества канала, как при включении услуги, так и в процессе эксплуатации без перерыва пользовательского трафика.
1.2 Мониторинг инфраструктуры ЦОД и облачных услуг
Облачные сервисы (SaaS) и предоставление инфраструктуры в облаке (IaaS) повсеместно становятся частью каталога услуг оператора связи. Однако нередко возникают вопросы («кто виноват в недоступности облачного приложения», «в чем причина низкой производительности виртуальной машины»), отсутствует разграничение ответственности между каналом связи от офиса клиента до ЦОД, доступностью самого сервера/виртуальной машины и облачного приложения.
Решение wiSLA.Telco для операторов обеспечивает:
- анализ готовности и производительности облачного сервиса из сети интернет за счет контроля времени загрузки WEB-ресурса с аппаратных зондов, имитирующих действия пользователей с ключевых магистральных узлов сети оператора;
- мониторинг инфраструктуры ЦОД путем анализа производительности IP-соединения (потеря пакетов, задержка, джиттер) между компонентами (виртуальными машинами) облачного сервиса внутри ЦОД;
- мониторинг жизнедеятельности серверов и виртуальных машин, на которых расположены облачные сервисы, за счет установки программного агента на каждый компонент и сбора показателей (загрузка процессора, загрузка оперативной памяти, оставшееся место на жестком диске и т.д.).
2. Для государственных учреждений и крупного корпоративного сегмента (B2B/B2G)
2.1 Мониторинг арендованных L2/L3 каналов
Большие компании и государственные учреждения часто сталкиваются с задачами обеспечения высокой доступности и производительности ИТ-систем, для которых связь между сильно географически разнесенными объектами играет ключевую роль. В связи с этим возникают задачи мониторинга и контроля арендованных у операторов связи каналов, так как операторы связи не всегда имеют необходимые для мониторинга инструменты.
Решение wiSLA.Enterprise обеспечивает:
- разграничение зоны ответственности за качество арендованных услуг с оператором связи за счет установки аппаратных зондов «в разрыв» соединения, что позволяет значительно повысить оперативность локализации неисправности и однозначно определить ответственного;
- мониторинг качества арендуемых услуг в режиме реального времени позволяет оперативно реагировать на случаи ухудшения качества контролируемой услуги, предвосхищать ее полный отказ и прогнозировать качество передачи пользовательского трафика;
- оперативное оповещение ответственных подразделений оператора связи об ухудшении качества/полном отказе услуги средствами электронной почты и sms-рассылки, а также всплывающих уведомлений на портале решения и мобильном приложении wiSLA позволяют повысить общую готовность внутренних сервисов компании за счет более быстрого устранения проблем арендованного канала;
- формирование периодических отчётов SLA на основе релевантных данных, доступных IT- подразделению, обеспечивают прозрачность взаимоотношений с оператором связи и обоснованную почву для расчета неустойки.
2.2 Мониторинг качества видеоконференцсвязи
В условиях сильной географической удаленности офисов компании видеоконференцсвязь (ВКС) становится наиболее эффективным и востребованным средством взаимодействия сотрудников. Однако от качества ВКС сильно зависит ее эффективность. Частые обрывы сеанса, пропадание фрагментов изображения и звука усложняют процесс взаимодействия людей и принятия решений.
Решение wiSLA.Enterprise обеспечивает:
- мониторинг транспортных каналов связи на основе встроенных шаблонов SLA, разработанных специально для контроля качества видеоконференцсвязи, которые содержат правила для показателей производительности каналов связи в зависимости от применяемого оборудования и типов аудио/видео кодеков;
- анализ достаточности полосы пропускания канала непосредственно перед сеансом ВКС на соответствие требованиям видео/аудио кодеков, применяемым в оборудовании ВКС;
- групповой мониторинг каналов участников во время сеанса ВКС позволяет в режиме реального времени контролировать соответствие качества каналов связи и ускорить локализацию причин ухудшения качества сеанса (канал связи или оборудование ВКС);
- периодические отчёты о готовности каналов связи к передаче трафика ВКС c детальной информацией о показателях качества каналов связи, времени, когда канал связи был не готов к проведению сеанса видеоконференцсвязи, а также результатах проведённых нагрузочных тестов.
2.3 Мониторинг корпоративных IT-сервисов
Доступность и производительность ИТ-систем является ключевым фактором эффективности работы современной компании. Однако гарантировать высокие показатели без соответствующего мониторинга — сложно реализуемая задача, особенно для облачных сервисов. Для быстрой локализации и устранения проблемы нужно четкое разграничение ответственности между каналом связи пользователя и системой, доступностью сервера и работы самого приложения.
Решение wiSLA.Enterprise обеспечивает:
- анализ готовности и производительности корпоративных ИТ-сервисов из офисов компании с помощью аппаратных зондов, имитирующих действия пользователей, установленных в офисах компании;
- разграничение ответственности между составляющими факторами доступности и производительности корпоративного приложения за счет многоуровневого анализа канала связи офиса (доступность сети, интернет или VPN-облака), производительность IP-соединения от офиса до сервера, на котором установлено приложение, время отклика самого приложения;
- мониторинг жизнедеятельности серверов и виртуальных машин, на которых расположены корпоративные сервисы — за счет установки программного агента на каждый компонент и сбора показателей (загрузка процессора, загрузка оперативной памяти, оставшееся место на жестком диске и т.д.).
Архитектура и состав платформы wiSLA
1. Общее описание архитектуры
ПАК wiSLA относится к разряду крупных корпоративных приложений, архитектура которого построена по многослойной модели и полностью соответствует ставшей стандартом модели Java Platform, Enterprise Edition (Java EE). Программное обеспечение ПАК wiSLA представляет собой систему распределенных компонентов, взаимодействующих через внутренние интерфейсы.
Все составляющие ПО ПАК wiSLA поддерживают спецификацию Java EE. Это позволяет легче обеспечивать высокое качество и надежность взаимодействия компонентов, полную согласованность с применяемыми технологиями, такими как Hibernate, Spring, AngularJS, OpenJDK 11 и др.
Это означает, что элементами архитектуры ПАК wiSLA являются компоненты, каждый из которых предоставляет необходимые сервисы, т.е. наборы выполняемых функций. Каждый компонент инкапсулирован, а его интерфейсы обеспечивают доступ к бизнес-правилам, данным и операциям. Все компоненты имеют спецификации, интерфейсы, описания реализации и внедрения. Компоненты, как и сервисы, разделены на три типа: служебные, бизнес-компоненты/сервисы и управляющие.
Взаимодействие между компонентами осуществляется с помощью общей коммуникационной среды — обобщенной шины для обмена информацией (Common Communication Vehicle, CCV).
2. Подсистема медиации (Mediation)
Подсистема медиации (Mediation) обеспечивает двустороннее взаимодействие системы с аппаратными и программными измерительными зондами, базами данных.
Сбор данных подсистемы спроектирован на базе многопоточной архитектуры с возможностью распределения и кластеризации отдельных инсталляций. Подсистема обеспечивает возможность работы с широким спектром измерительных средств и масштабируемость решения в части увеличения количества зондов и их территориального распределения.
Ключевые особенности подсистемы:
- Распределенная структура коллекторов. В целях повышения отказоустойчивости и производительности функций сбора данных с многотысячного парка устройств на различных сегментах сети по географическому или функциональному признаку могут быть выделены специальные коллекторы, выполняющие функции агрегации операций по сбору данных и оптимизации нагрузки на центральные компоненты подсистемы;
- Независимые адаптеры. Сбор данных с каждого конкретного типа устройств осуществляется единым внутренним интерфейсом с помощью специально разработанных адаптеров, выполняющих набор устройство-специфичных действий. Это позволяет разработчикам в «горячем режиме» вносить изменения в каждый адаптер по отдельности и легче поддерживать новые версии прошивок устройств;
- Поддержка устройств за NAT. Подсистема сбора данных может работать не только в классическом активном режиме (SNMP-запросы, выполнение CLI-команд в Telnet/SSH), но и принимать SNMP Trap, HTTP Get/Post запросы от измерительных средств и внешних систем.
3. Подсистема управления SLA (SLM)
Центром платформы wiSLA является подсистема управления SLA (Service Level Management), которая обеспечивает выполнение набора ключевых функций в рамках процесса управления качеством услуг: формирование периодических отчётов SLA, расчет компенсаций за нарушение уровня обслуживания и учет времени согласованных перерывов работы (отключение электропитания в офисе клиента, планово- профилактические работы, форс-мажоры и т.д.).
Ключевые особенности подсистемы:
- Гибкий конструктор параметров SLA. Заложенная в систему модель вложенности шаблонов SLA (набор показателей качества услуги и их пороговые значения) и классов обслуживания, описывающая уровень реагирования на проблемы клиента (время на устранение аварий, уровни эскалации SLA), позволяет отвечать любым запросам различных групп клиентов, сохраняя при этом индивидуальный подход;
- Настраиваемые правила расчета. Анализ и оценка уровня обслуживания основана на гибко настраиваемом механизме расчета ключевых показателей качества: готовность услуги, суммарное время необслуживания, среднее время между авариями и др. Т.е., например, для расчета суммарного времени неготовности услуги могут браться только интервалы, которые не обслуживались более 15 минут, игнорируя при этом более короткие.
4. Подсистема мониторинга качества сервиса (SQM)
Подсистема мониторинга качества сервиса (SQM) обеспечивает непрерывный мониторинг и оперативную оценку качества услуг с точки зрения потребителя в любой момент времени.
Важной составной частью SQM является SQM-монитор, который реализован на базе Java Message Service. В каждом цикле сбора данных SQM-монитор сравнивает значения показателей качества услуги со значениями в настройках мониторинга и определяет статус сервиса. Значения, указанные в настройках мониторинга, по умолчанию соответствуют значениям указанным в SLA и могут быть изменены оператором.
К функциям, реализуемым подсистемой, относятся:
- анализ поступающей от подсистемы сбора данных информации:
- сравнение значений показателей качества с установленными SLA порогами,
- частота обновления информации от 10 секунд до 5 минут;
- сравнение значений показателей качества с установленными SLA порогами,
- инициация нагрузочного тестирования контролируемых услуг;
- формирование оперативных отчётов показателей производительности услуг (KPI);
- мониторинг группы каналов в момент проведения видеоконференции.
Ключевые особенности подсистемы:
- Обработка BigData. Для повышения производительности и обработки массивного потока данных, поступающих от измерительных зондов, используется нереляционная распределённая база данных HBase, которая обеспечивает отказоустойчивый способ хранения больших объёмов разреженных данных;
- Многогранный мониторинг. Архитектура и объектная модель подсистемы SQM обеспечивает возможность мониторинга одной услуги в различных срезах, например, оценить качество канала связи между Москвой и Новосибирском в разрезе прохождения различных типов трафика (данные, голос, видео и др.).
5. Подсистема учета неисправностей (Service Desk)
Подсистема учета неисправностей (Service Desk) отвечает за регистрацию аварийных событий контролируемых услуг и своевременное оповещение ответственных пользователей о неисправностях посредством электронной почты и SNMP-уведомлений, а также многоуровневую эскалацию проблем.
Высокая скорость реакции на аварийное событие достигается за счет взаимодействия с подсистемой мониторинга качества сервиса SQM. При каждом поступлении данных о качестве услуги анализа состояния сервиса подсистемой SQM подсистема SD фиксирует изменения и в случае перехода статуса сервиса в отказ или деградацию запускает таймер, по истечению которого открывается паспорт неисправности.
Ключевые особенности подсистемы:
- Встроенный FM-engine. В подсистему учета неисправностей заложены все базовые функции управления жизненным циклом аварии (открытие, обработка, приостановка, закрытие), а также корреляция аварийных событий по времени открытия, точкам доступа и классам трафика;
- Гибкая настройка времени реакции. Подсистема учета неисправностей позволяет гибко настраивать время реакции системы на аварийные сигналы. Паспорт неисправности может быть открыт с минимально возможной задержкой или через заданное время, в течение которого услуга находится в аварийном состоянии. Это позволяет избегать шквалов уведомлений о кратковременных проблемах.
6. Подсистема учета (SMDB)
Подсистема учета (SMDB) обеспечивает учет и управление инфраструктурой контролируемых услуг и измерительного оборудования. Подсистема обеспечивает управление взаимосвязями между такими сущностями, как контрагент, контракт, сервисы, измерения, точки доступа, зонды (измерительное оборудование или устройства) и тесты в соответствии в SID (Shared Information and Data Model). Согласно TAM (Telecom Operations Map), подсистема учета выполняет функции Resource Inventory, Service Inventory, Customer Inventory (CRM). В подсистеме учета также хранятся цепочки показателей качества и производительности KPI/KQI в привязке к сервисам.
7. Интеграционная платформа (Integration Framework)
Интеграция wiSLA с внешними системами OSS/BSS выполняется посредством интеграционной платформы (Integration Framework). В основу платформы заложены сервисно-ориентированная архитектура (SOA) и открытые интерфейсы (WSDL/SOAP/XML). wiSLA содержит предынтегрированные модули к существующим системам Trouble Ticketing, Fault Management, Order Management, а также модули к внешним Web-порталам Заказчика. Дополнительно в рамках интеграционной платформы может поставляться модуль управления бизнес-процессами (BPM).
8. Портал оператора (Operator Portal)
Портал оператора ПАК wiSLA предназначен для управления системой: постановки услуг (сервисов) на мониторинг, настройки параметров SLA, управления правами доступа пользователей, журналирования системных событий.