- Высокий уровень масштабируемости системы.
- Отказоустойчивая архитектура, обеспечивающая автоматическое восстановление своей работоспособности при сбоях.
- возможность постепенного планомерного развития системы, когда модернизация и полная замена ресурсов рабочей системы происходит без прекращения функционирования;
- применение передовых и перспективных решений и технологий;
- использование стандартных технологий, гарантирующих независимость от конкретных поставщиков оборудования и программного обеспечения.
Ориентация на самые передовые и перспективные решения при создании ЦОД необходима, поскольку сроки эксплуатации внедряемых решений традиционно вели-ки, что обусловлено большими капиталовложениями в системы такого рода.
Архитектура ЦОД.
Основой ЦОД является отказоустойчивый кластер, работающий под управлением операционной системы. Кластерная архитектура является сегодня промышленным стандартом для построения высоконадежной, производительной и масштабируемой вычислительной системы.
Все предлагаемые в данном секторе рынка продукты разделяются на две группы:
- Кластеры, или системы «высокой готовности» (HA - High Availability).
- Кластеры параллельных баз данных. Для построения кластеров парал¬лельных баз данных предлагается Oracle Parallel Server (OPS) - ПО СУБД компании Oracle.
Наиболее полно требованиям бесперебойной работы ЦОД удовлетворяет схема построения системы на основе слабосвязанного многомашинного комплекса — кластер НА-системы. Такое решение предусматривает два уровня масштабируемости: за счет увеличения числа узлов кластера и с помощью наращивания ресурсов отдельного узла. Во втором случае каждый узел кластера не только увеличивает производительность своей работы, но и становится дополнительным резервным эле-ментом системы.
Кластер представляет собой объединение нескольких автономных функционально полных компьютерных систем (узлов), конфигурация каждой из которых обеспечивает независимую работу узла. Эти системы строятся на базе серийно выпускаемого оборудования, как правило, высокопроизводительных серверов, обладающих общими разделяемыми ресурсами и объединяемых высокоскоростной сетевой магистралью. Основной разделяемый ресурс кластера — дисковые подсистемы, доступные для всех узлов кластера.
В кластерных и HA-системах особое внимание уделяется обеспечению бесперебойной работы и восстановлению при сбоях, что включает:
- локализацию ситуации сбоя;
- автоматическую переконфигурацию комплекса и переход его в другое работоспособное состояние при минимальных издержках. Система обеспечения отказоустойчивости обнаруживает неисправности и восстанавливает работоспособность системы в следующих ситуациях:
- сбой в работе процессоров, оперативной памяти, системного блока компьютера;
- сбой в работе адаптеров локальной вычислительной сети, контроллеров внешней и внутренней шины ввода/вывода;
- сбой в работе внешней и внутренней массовой памяти, дисковых накопителей;
- сбой в работе критически важных приложений и операционной системы.
Хранилище данных.
Составной частью кластера является подсистема массовой памяти (дисковая подсистема), доступная всем узлам ЦОД. Для обеспечения гарантированной работоспособности кластера каждый из узлов должен иметь несколько альтернативных путей доступа к данным через несколько различных контроллеров ввода/вывода.
Для связи узла с дисковой подсистемой используется технология Fibre Channel, поддерживающая скорость обмена данными до 2000 Мбайт/сек). Применение Fibre Channel дает ряд неоспоримых преимуществ по сравнению с давно используемым интерфейсом SCSI:
- гибкость переконфигурации системы, например, при подключе¬нии новых серверов или переносе данных между отдельными подсистемами за счет отсутствия единой шины передачи данных;
- увеличение скорости обмена информацией;
- увеличение допустимого расстояния между дисковой подсистемой и хост-компьютером до 500 м (Differential SCSI - 25 м);
- максимальное количество адресуемых устройств - 128;
- ориентация ведущих поставщиков оборудования на стандарт Fibre Channel;
- возможность создания сети устройств хранения данных на базе передовой технологии Storage Area Network (SAN).
Архивная система.
ЦОД на базе отказоустойчивого кластера с использованием высоконадежных дисковых устройств защищен от аппаратных поломок и сбоев в системном ПО. Однако всегда остается некоторая вероятность потери или искажения информации, с целью учета которой на предприятии всегда создается система оперативных и долговременных архивов данных и разрабатывается эффективная стратегия резервного копирования.
Выделенная архивная система состоит из двух основных частей:
- сервер архивов;
- роботизированная библиотека устройств хранения информации.
Сетевая среда ЦОД строится на основе архитектуры, включающей резервирование важнейших компонентов сети и обеспечивающей автоматическую реконфигурацию системы при выходе из строя любого из ее компонентов.
Для взаимодействия узлов ЦОД и передачи внутрикластерного трафика организуется отдельная подсеть. Из всех высокоскоростных сетевых сред передачи данных наиболее предпочтительна технологии 10GE или Gigabit Ethernet для внутрикластерного соединения.
Поскольку система ЦОД является критически важным элементом информационной инфраструктуры предприятия, при выборе производителя оборудования следует отдавать предпочтение компаниям, лидирующим в данном секторе рынка. Такими компаниями являются Hewlett-Packard и Sun Microsystems, поставляющие надежные UNIX и Intel решения, способные стать прочной платформой для корпоративных приложений.
