Облачное хранилище данных: взять максимум, потратить минимум

Tags: хранилище данных, cloud

Сегодня облачное хранение играет важную роль в современных стратегиях управления данными.  Организации всех типов и размеров прибегают к его использованию, но в различной степени: одни - в качестве дополнения к локальным системам, другие же для управления большей части данных. 

Облачное хранение относится к системе, в которой хранение данных предлагается облачными провайдерами в качестве услуги, обычно в составе других облачных услуг.  Хранение осуществляется в собственных дата-центрах провайдера или в арендованных пространствах. Дата-центры могут располагаться как в пределах одной географической области, так и быть рассредоточенными в нескольких регионах.

Провайдер контролирует все бэк-энд операции, связанные с администрированием инфраструктуры, хранением и предоставлением услуг.  Команда экспертов управляет средами, защищает их и данные, выполняет административные задачи: обновление данных, внедрение защиты данных, обеспечение доступности.

Архитектура облачного хранилища

Облачное хранилище поставляется через виртуализированную инфраструктуру, которая логически группирует физические ресурсы хранения и представляет их как услуги, доступные через централизованный портал. Клиенты взаимодействуют с пулом хранения через публичный API, который облегчает доступ и управление данными.  Пул хранения может охватывать несколько серверов или даже местоположений, при этом данные распределены по дискам.

На рис. 1 схематически представлена архитектура облачного хранилища. Изображение дает представление о формировании физических ресурсов хранения в логические пулы, которые затем используются как часть стратегии управления данными.

Рис.1 Архитектура облачного хранилища

Из рисунка видно, что провайдер может поддерживать до трех типов хранения: объект, блок, файл. 

  • Объектное хранение разрабатывалось для решения проблемы растущего притока неструктурированных данных.  В этом типе хранения данные разбиты на объекты, содержащие идентификаторы и клиентоориентированные метаданные. Это упрощает доступ и поддерживает продвинутую аналитику.  Объектное хранение работает не так хорошо, как блочное, особенно, когда речь идет о записи данных. Поэтому этот вариант наилучшим образом подходит к рабочим нагрузкам нечувствительным к задержкам, например, резервное копирование и архивирование. 
  • Блочное хранение разбивает данные на блоки, в которых вместо метаданных есть только уникальный идентификатор.  Сети хранения данных (SAN) используют данный вариант, т.к. он быстрее и эффективнее, наилучшим образом подходит таким рабочим нагрузкам, как почтовые серверы, реляционные базы данных и инфраструктуры виртуальных рабочих столов. 
  • У файлового хранилища иерархическая структура, которую Вы можете встретить в таких приложениях, как Windows Explorer or macOS Finder. Этот тип хранилища используется каждодневными приложениями, системами хранения данных с прямым подключением (DAS) и сетевым хранилищем (NAS). Оно простое в работе, у него строгие ограничения масштабируемости, поддерживает небольшое количество метаданных.

Некоторые облачные провайдеры предлагают только один или два типа хранилищ, но главные современные игроки предоставляют все три, при этом объектное и облачное хранилище поддерживают основную массу корпоративных рабочих нагрузок.

Мир облачного хранилища

Большинство организаций все чаще используют облачное хранение из-за структуры оплаты, которая позволяет перейти от модели капитальных затрат к модели операционных затрат.  Это не только исключает чрезмерные начальные расходы, обычно сопровождающие локальные решения хранения, но дает возможность избежать избыточного выделения ресурсов для обеспечения изменяющихся рабочих нагрузок или вероятного увеличения объема данных.

Услуги могут облагаться базовыми платежами, но в сравнении с тратами на покупку, размещение и администрирование они выглядят незначительными.  Тем не менее, затраты имеют особенность быстрого роста. Это связано с адаптационной способностью облачного хранилища.  Клиенты могут увеличивать и уменьшать масштаб согласно требованиям бизнеса. Емкость облака практически безгранична, пока Вы можете за него платить.

Преимуществом облачного хранилища является глобальная доступность 24х7 из любой точки, предоставляя бизнес-пользователям и приложениям с выходом в интернет доступ к данным в любое время. Они могут использовать протоколы такие как Web Distributed Authoring и  Versioning (WebDAV) для увязывания локальных дисков с облачным хранилищем, тем самым обеспечивая большую гибкость.

Другой причиной популярности облачного хранилища является их простое использование любым участником процесса, будь то администратор, разработчик, тестировщик или конечный пользователь. Централизованный портал и API обеспечивают быстрое и эффективное выполнение операций, изменение существующих конфигураций, взаимодействие с другими пользователями и работу с данными. Облачное хранилище ускоряет и упрощает множество повседневных операций локального хранилища.

Встроенные средства защиты позволяют решать проблемы потери данных и безопасности.  Встроенная избыточность и распределенные данные приводят к высокой степени отказоустойчивости. Провайдеры принимают меры, защищающие данные от потери и отсутствия доступности в случае поломки оборудования, природных катастроф или человеческих ошибок, а также гарантирующие, что вся конфиденциальная информация защищена от внутренних и внешних угроз. К способам защиты относятся мониторинг, сетевые устройства защиты, шифрование, обнаружение нападения, мультифакторная аутентификация и обеспечение безопасности на физическом уровне. Многие поставщики понимают, что на кону стоит их репутация, поэтому делают все возможное для предотвращения хищения данных.

Темная сторона облачного хранилища

Несмотря на усилия поставщиков, направленные на обеспечение безопасности данных, именно безопасность остается одной из важнейших причин, по которой компании не решаются переносить данные в облако. Даже при самых благоприятных обстоятельствах, хранение данных в облаке увеличивает поверхность атаки, поскольку данные пересекают несколько сетей, распределены по локациям, чаще реплицируются.   Чем больше поверхность атаки, тем выше вероятность того, что данные могут быть скомпрометированы.

Кроме того, провайдерам необходима защита от внутренних угроз, проявляющихся в виде шпионажа, недобропорядочных работников или неосторожных внутренних действий; важно принимать во внимание вопросы обеспечения конфиденциальности и норм соответствия.  Клиенты ставят многое на карту, когда речь идет о защите персональных данных.  Скомпрометированные данные могут привести к судебному иску, санкциям, подорванной репутации. И несмотря на действия провайдеров для решения вопросов конфиденциальности, многие организации все еще предполагают, что риск слишком велик, чтобы доверить данные облаку.

Но в случае, если организацию устраивает предлагаемый уровень защиты, ей необходимо учитывать стоимость хранения данных в облаке. На первый взгляд, модель капитальных вложений может показаться недорогой альтернативой локальному хранилищу, но долгосрочный анализ, определяющий истинную совокупную стоимость владения, часто рисует другую картину, ведь он учитывает постоянную абонентскую плату, дополнительные затраты за увеличение емкости и производительности, сборы за перенос данных и высокоскоростные сетевые соединения и др. факторы.

В тоже время облачное хранилище означает потерю контроля над данными.  У компаний есть доступ к данным, возможность обновления и миграции данных, но нет возможности определить, применены ли патчи безопасности или запланировано ли обслуживание, контролировать как система оптимизирована или когда более новые технологии могут быть внедрены.  Провайдер регулирует почти каждый аспект каждой операции, относящейся к платформе.

Другая проблема облачного хранилища состоит в том, может ли организация зависеть от провайдера, чтобы оставить бизнес в облачном хранилище в обозримом будущем. Компания может обанкротиться, быть поглощена другой компанией, изменить бизнес-стратегию, пережить катастрофу или исчезнуть по другим причинам.  Это не только ставит под угрозу повседневные операции, но может препятствовать получению доступа к данным.

Частные и гибридные облачные хранилища

И хотя у многих организаций возникает обеспокоенность по вопросу облачного хранилища, им нравится модель предоставления услуг, которую дает облако, поэтому некоторые разворачивают частные или гибридные облака. Частное облако - это выделенная платформа, которая предлагает ресурсы хранения и вычисления, подобные публичному облаку. Компоненты, составляющие инфраструктуру частного облака, могут быть размещены отдельно или совместно с провайдером, но в обоих случаях у организации будет полный контроль над всеми компонентами.

Частное облако предлагает такую же гибкость, масштабируемость, эффективность и простоту в использовании как и публичное, хотя не в такой же степени. Тем не менее,  частное облако может быть полезным решением для компаний, которые хотят больше контроля над хранилищем или у которых строгие правила безопасности и соблюдения требований (например, правительственные организации, финансовые институты, учреждения здравоохранения)

Несмотря на преимущества частного облака, процессы внедрения и администрирования инфраструктуры могут быть сложным и дорогостоящим, а компании должны быть хорошо подготовлены к подобному проекту.  Это требует не только тщательного планирования и бюджетирования, но наличие персонала с необходимым опытом.  В качестве альтернативы, некоторые компании используют хранилище на основе потребления, которое использует распределительный подход к управляемым локальным услугам. Иногда организации хотят развернуть частное облако, но все еще используют публичное для некоторых хранилищ.  Одна из опций - это поддержка отдельных операций.

Другим подходом является гибридное облако, в котором частное и публичное облачные хранилища координируются уровнем оркестрации, который интегрирует операции на нескольких платформах.  При эффективном гибридном облачном решении организации могут сохранять строгий контроль над данными, при этом максимально использовать преимущества частной и публичной платформ.

Изначально, облачное хранилище рассматривалось как средство для сокращения капитальных затрат для небольших организаций, позволяя им хранить данные в публичной облачной платформе без оплаты за хранение.  Сегодня организации всех форм и размером используют облачное хранение, беря преимущества от различных вариантов развертывания для по поддержки широкого круга рабочих нагрузок, таких как аварийное восстановление, архивирование файлов, процессы разработки DevOps, сезонные колебания, аналитика интернета вещей и т.д.

Но у облачного хранения есть ряд недостатков.  Например, проблемы безопасности и конфиденциальности, а также вопросы, связанные с зависимостью от поставщика и осуществлением контроля клиентом. Еще одной проблемой, о которой не было сказано в статье, является способность облака справляться с увеличением объемов данных в следующие несколько лет.  Но об этом в следующий раз.

 

No Comments

Add a Comment