Описание структуры ПО в организации

Одним из самых критичных компонентов в компании являются базы Microsoft SQL Server, которые поддерживают работу системы управления ресурсами предприятия (ERP), а также работу сервера Lotus Domino. Если данные системы будут недоступны более четырех часов, то бизнес остановится, что также повлияет и на потребителей компании. В организации реализована централизованная модель, таким образом, что все филиальные офисы подключаются к системе ERP расположенной в главном офисе. В случае потери доступа к данной системе, то будет отсутствовать возможность вводить заказы и осуществлять доставки потребителям, а в случае простоя в течение четырех часов исказятся данные о наличие товаров.

Lotus Domino также является критичным компонентом, и не только из-за своих почтовых функций. Система управления взаимодействием с клиентами (CRM) основывается на базе данных Lotus Domino. Таким образом, если сервер Domino будет недоступен, организации потеряет доступ не только к почте, а также будет отсутствовать возможность любого взаимодействия и покупателями.

Несмотря на то, что компания никогда не сталкивалась с самым худшим сценарием отказа системы, механизм восстановления не был достаточно надежным, каким следовало. Компания использовала встроенные механизмы восстановления SQL Server для репликации данных на запасную площадку восстановления (DR site), но без внедрения технологий кластеризации в центральном офисе.

Domino сервер иногда зависал и для перезагрузки требовалось около 30 минут. Зависимость от IT систем стала настолько велика, что цена простоя становилась неприемлемой. Таким образом, если даже проблему можно было решить путем установки двух идентичных серверов в центральном офисе, выход из строя обоих серверов приводил к восстановлению работы системы в течение нескольких дней.

Формулировка задачи

Планируется создание высоконадежного кластера серверов Lotus Domino, а также отказоустойчивого кластера SQL серверов. При выходе из строя или потере связи с основным сервером, в автоматическом режиме службы должны запускаться на резервных серверах в течение5-10 минут.Решение должно обеспечить полную защиту системы при выходе из строя головного офиса, с приемлемым временем восстановления. Планируется создание надежной системы защиты от спама и возможность реализации бэкапа в рабочие часы.

Решение должно обеспечить

Windows сервера

  • Онлайн конфигурирование с использованием динамических дисков — Оптимизация производительности системы хранения и доступности без прерывания работы операционных систем и приложений
  • Централизованное управление и оповещение — Повышается эффективность работы и визуальная доступность с помощью централизованного управления и оповещения множества хостов, а также обеспечиваются непрерывные операции с системой хранения
  • Поддержка множества аппаратных платформ различных производителей — Снижаются капитальные затраты благодаря поддержке гетерогенных операционных систем и аппаратного обеспечения
  • Высокая доступность для критичных Windows приложений — Предоставляет единое кластерное решение, как для локальных решений, так и для распределенных отказоустойчивых решений

Для почтовых серверов (Lotus Domino, Exchange) и баз данных (MS SQL)

  • Высокая доступность на любом расстоянии — возможность построения как локальных так и удаленных кластерных систем для восстановления после катастроф и локальной высокой доступности
  • Быстрое восстановление после логических ошибок — Быстрое восстановление с помощью технологии снэпшотов, позволяющей быстро откатывать систему назад после возникновения ошибок и повреждения данных, исключая длительные восстановления с пленочных носителей
  • Отсутствие единой точки отказа — Отсутствие центрального управляющего узла типа «master» . Таким образом, в случае выхода из строя одного из серверов в кластере почтовый сервер «переезжает» на другой сервер, скоординировав перемещение с СХД
  • Автоматическое тестирование сценария восстановления после катастрофы — Тест покрывает как восстановление, так и репликацию данных, без затрагивания рабочей среды

Для репликации данных

  • Репликация данных на любое расстояние — Репликация данных на любое расстояние без влияния на производительность критических приложений
  • Репликация независящая от типа СХД —репликация между гетерогенными устройствами хранения данных, возможность хранения данных в зависимости от их типа как часть плана по восстановлению
  • Масштабируемая производительность для работы в различных средах
  • Централизованное управление и предоставление отчетов — централизованный мониторинг и управление множеством реплицируемых данных с различных сайтов
  • Обеспечение целостности данных и баз данных — Защита целостности данных в течение всего периода времени благодаря использованию постоянных логов репликации
  • Автоматическое восстановление после сбоев — быстрое автоматическое восстановление одного сайта на другой для критических приложений

Описание решения

Когда компания переходила на централизованную модель управления, было принято решение внедрить решение, обеспечивающее высокую доступность. Системным интегратором, компанией ОЛЛИ было рекомендовано решение Veritas Storage Foun­dation™ HA/DR для Windows, которое включает Veritas™ Cluster Server, обеспечивающий высокую доступность, а также Veritas™ Volume Replicator для репликации данных между центральным офисом и удаленной площадкой.

В головном офисе развертывается два кластера: первый состоит из двух узлов Microsoft SQL Server 2005, в режиме active-active, второй — из трех узлов Lotus Domino, файловых служб и служб печати, также в режиме active-active. В качестве централизованного хранилища данных для обоих кластеров используется HP EVA 4000 SAN.

Теперь, благодаря Veritas Cluster Server, компания может восстановить работу системы локально в течение нескольких минут, по сравнению с предыдущими сценариями восстановления, занимающими от нескольких часов до нескольких дней. Таким образом, мы получили время аптайма системы 99.999 процентов.

Улучшенное время восстановления всей системы

Также было рекомендовано расширить данное решение, включив в него восстановление всей системы благодаря функциям Storage Foundation HA/DR. Организация, используя опцию Veritas Volume Replicator, теперь обладает возможностью делать репликацию критичных данных на удаленную площадку, находящуюся в800 километрах.

Из возможных аналогов данного решения были рассмотрены встроенные инструменты репликации SQL, а также репликация на базе SAN, но ни одно из них полностью не удовлетворяло требованиям. Один из минусов решений аппаратной репликации их плохая совместимость и «осведомленность» о более высших уровнях, например, таких как уровень приложений. Veritas Volume Replicator гарантирует качество и порядок записи, и всегда известно, что том расположенный на запасном сайте идентичен тому в рабочей системе. Предложенное решение в буквальном смысле позволяет произвести восстановление системы на запасном сайте в течение15-тиминут простым нажатием кнопки.

Для проверки работоспособности данного сценария восстановления всей системы в Veri­tas Cluster Server встроен компонент Fire Drill, позволяющий проверить способность восстанавливаться — без прерывания работы и доступности сервисов.

Fire Drill выполняет одно из основных требований, и без данного компонента, тестирование восстановления в обычных условиях было бы не приемлемо, и таким образом, нельзя было бы проверить насколько уменьшилось время по восстановлению всей системы (RTO). Используя Storage Foundation HA/DR, компания добилась времени восстановления менее15-тиминут, в отличие от предполагаемых 12 часов до внедрения.

В компании был также внедрен Storage Foun­dation Manager для управления подключениями между серверами и HP StorageWorks EVA 4000 SAN в головном ЦОДе, а также HP StorageWorks MSA2000 iSCSI SAN на запасной площадке. Благодаря данному ПО появилась возможность одновременного управления (с использованием одного и того же набора функций) из единой консоли как СХД уровня предприятия, так и СХД начального уровня, устанавливаемого в филиалах.

Используя динамические диски, организация получает возможность добавления дополнительного дискового объема без прерывания доступности системы. Это означает, что организация теперь может добавлять дополнительное дисковое пространство к файл серверу или серверу Lotus Domino сколь угодно раз без остановки данных сервисов. До использования Storage Foundation раз в полгода-год существовала необходимость бэкапа данных, выключении серверов, замены дисков на диски с большим объемом, восстановлении данных, а затем в переустановке соответствующих приложений — т.к. как итог несколько дней работы. После внедрения Storage Foundation данных процесс занимает около пяти минут.

В ближайшее время планируется использование такой функции Storage Foundation как FlashSnap для того чтобы делать целостные и оптимальные по занимаемому месту копии баз SQL Server для ускорения процесса бэкапа. FlashSnap полностью интегрируется с Windows Server Volume Shadowcopy Service (VSS) и поддерживает снэпшоты на основе VSS, используя интегрированный VSS Snap­shot Scheduler и VSS Software Snapshot Provider. Данные снэпшоты могут быть использованы для быстрого восстановления или off-host бэкапа серверов Microsoft SQL Server 2005.

FlashSnap существенно снизит потребности в дисковом пространстве, как на основном, так и вспомогательном сайте, а также позволит делать бэкап в течение дня не влияя на рабочую загрузку.

100 процентный успех при восстановлении

Для бэкапа и восстановления было рекомендовано решение Symantec Backup Exec™ для Windows. Бэкап производится на пленку и уровень успешного бэкапа достигает 99 процентов. В день делается полный бэкап порядка одного терабайта. Уровень восстановления данных составляет 100%.

Компания использовала агентов Backup Exec для Microsoft SQL Server и сервера Lotus Domino для осуществления горячего и непрерывного бэкапа баз данных и данных Lotus Notes. Компания рассматривает возможность добавления опции Backup Exec Advanced Disk-based для осуществления более быстрого бэкапа и восстановления. Т.е. используя опцию Advanced Backup больше нет необходимость полагаться на ночные бэкапы, а используя FlashSnap производить бэкап в течение дня.

99 процентное блокирование спама

Для фильтрации спама, прежде чем он достигнет почтового сервера Lotus Dom­ino, в компании был внедрен Symantec Brightmail™ Gateway в качестве барьерного SMTP хоста. Brightmail останавливает спам атаки методом TCP traffic-shaping, распознавая спаммеров, путем снижения скорости, с которой отправляются почтовые сообщения. Также применяются специальные фильтры на основе репутации, которые отвечают за блокировку или разрешение IP адреса отправителя, основываясь на истории сообщений.

До внедрения в компании использовалось несколько уровней фильтрации, но фильтровалось 75% спама. После внедрения Brightmail данная цифра достигла 99 процентов. К другим преимуществам данного решения можно отнести улучшенную защиту UNIX серверов, улучшенное управление почтовыми штормами, также в Brightmail встроены функции предотвращения атак отказа в обслуживании (DoS) и защиту атак на Windows системы.

Полученные результаты

Поставленные задачи

  • Получить высокую доступность для критичных систем
  • Добиться времени восстановлений в 15 минут для восстановления всей системы
  • Эффективный бэкап и восстановление почтовой системы и базы данных
  • Более эффективно отфильтровывать спам

Продукты Symantec

  • Veritas Storage Foundation™ HA/DR for Windows
  • Veritas Storage Foundation
  • Veritas™ Cluster Server
  • Veritas™ Volume Replicator
  • Symantec Backup Exec™ для Windows Servers, со следующими агентами:
  • Backup Exec Agent for Lotus Domino Server
  • Backup Exec Agent for Microsoft SQL Server
  • Symantec Brightmail™ Gateway

Партнер Symantec

  • «ООО ОЛЛИ лтд.» (www.olly.ru)

Информационная инфраструктура

  • Серверная платформа: Серверы HP ProLiant Microsoft Windows Server 2003
  • Приложения: SAP, Lotus Notes
  • Базаданных: Microsoft SQL Server 2005
  • Система хранения данных: HP StorageWorks EVA 4000 SAN; HP StorageWorks MSA2000 iSCSI SAN на запасной площадке
  • Ленточная библиотека: HP StorageWorks MSL6000

Бизнес результаты и полученные преимущества

Высокая доступность

  • 99.999 доступность для ERP систем
  • Локальное восстановление в течение двух минут для ERP систем и сервера Lotus Domino
  • Автоматическое восстановление в течение 15 минут на удаленную площадку
  • Уменьшение времени восстановления с 12 часов до 15 минут

Управление системой хранения

  • Управление СХД Fibre Channel и iSCSI из единой консоли
  • Исключение времени простоя при добавлении дополнительных емкостей
  • Предсказуемо снижение затрат на приобретение дополнительных дисков благодаря экономии с использованием технологии FlashSnap

Защита данных

  • на 99% и более лучший уровень бэкапаor greater backup success rate
  • 100уровень восстановления
  • Почтовая безопасность:
  • 99% улучшенная фильтрация спама(улучшена с 75%)
  • Отсутствие времени простоя в случае DoS атак No

Позвоните нам +7 812 703-30-60 
получите консультацию и расчет внедрения

Или 

напишите нам

Компания «ОЛЛИ» осуществляет оказание комплекса услуг, направленных на разработку, создание и внедрение ИТ-технологий и систем управления предприятиями. Квалифицированная интеграция технологий и систем позволят повышать эффективность деятельности коммерческих организаций и государственных структур.