Современные технологии хранения данных для Вашего бизнеса

Tags: хранилище данных, DWH, database

Давайте рассмотрим пять современных технологий, которые постоянно внедряются в IT инфраструктуры: программно-определяемая сеть хранения, виртуальная сеть хранения, интеллектуальное хранение, «вычислительное» хранение, твердотельное устройство хранения данных.  

Программно-определяемая сеть хранения

И хотя традиционные конфигурации хранения все еще играют важную роль, они не могут покрыть потребности нынешних огромных массивов динамических, распределенных и гетерогенных данных.  Некоторые IT команды решают эти проблемы с помощью программно-определяемой сетью хранения (SDS) - программное решение, предоставляющее слой абстракции между приложениями и устройствами хранения, отделяя программное обеспечение хранилища от аппаратного обеспечения.

В идеале, решение SDS должно работать на типовых серверах и поддерживать широкий круг устройств хранения, устраняя любые зависимости от "родного" оборудования или его программного обеспечения.   Решение SDS обрабатывает запросы на хранение от приложения, управляя при этом самими ресурсами хранения.  Отделение плоскости данных от плоскости контроля может привести к большей операционной быстроте и контролю над тем, где и как хранятся данные.

Хотя производители используют различные подходы к SDS, решения обычно используют виртуализацию для консолидации физических устройств хранения в пулы логических ресурсов, которые могут динамически управляться и быть распределены между необходимыми приложениями. Решение SDS предоставляет стандартные API для обеспечения и управления ресурсами, упрощая автоматизацию операций, поддерживает трудоемкие разработки (например, инфраструктура как код (IaC)) и интегрирует с инструментами оркестровки контейнера, например с Kubernetes.

Одним из главных преимуществ SDS является гибкость.  Не только IT командам доступен широкий выбор технических средств, но приложения также получают выгоду, т.к. ресурсы хранения могут быть распределены и масштабированы по запросу. Кроме того, решение SDS может лучше реализовывать физические ресурсы, которые приводят к уменьшению затрат, особенно, когда Вы устраняете собственные системы хранения и зависимость от поставщика.  Иногда SDS может повышать производительность за счет использования параллелизма, многоуровневого хранения и кэширования данных.

Но у SDS есть свои недостатки.  Внедрение и администрирование решения SDS может быть сложным предприятием, особенно работая с несколькими продуктами хранения от различных поставщиков, что затрудняет поддержку или даже определение проблемы. Решения SDS не такие независимыми от аппаратного обеспечения как кажется, и могут не включать все доступные функции для собственных выделенных систем.

Виртуальная сеть хранения данных (SAN)

Другая технология, которую используют компании для решения проблем современных рабочих нагрузок - виртуальная сеть хранения данных (VSAN), механизм разделения и изоляции трафика в таких сетях, как Fibre Channel или Ethernet. В конфигурации VSAN физическая сеть SAN разбивается на логические части, которые изолируют устройства, подключенные к одной системе.  Например, вы создаете VSAN для разделения команд с различными требованиями к безопасности или производительности, или Вы можете использовать для изоляции трафика резервного копирования от производственного трафика.

Этот тип VSAN отличается от того, который вы видите в продуктах, использующие термин виртуальная SAN, VSAN или даже vSAN для описания возможностей SDS.  Например, VMware предлагает продукт под названием vSAN и решение SDS, используемое вместе с VMware vSphere для предоставления базы для гиперконвергентных инфраструктур.  VMware vSAN создает пулы логических ресурсов, состоящие из устройств DAS, подключенных к кластерам инфраструктуры vSphere, а затем делает эти ресурсы доступными для виртуальных машин кластера.

Каждая логическая SAN поддерживает те же операции и конфигурации доступные для физической SAN, но они могут быть настроены независимо для удовлетворения запросов.  Устройства внутри vSAN могут свободно сообщаться между собой, но не могут с устройства за пределами их собственной VSAN, даже если они подключены к одной физической SAN. В таком случае организация может построить единую топологию SAN, но с преимуществами логических топологий, для которых неважно географическое расположение коммутаторов SAN и подключенных устройств.

VSAN Cisco была утверждена в качестве стандарта Американским национальным институтом стандартизации в октябре 2004 г. И, хотя VSAN не может считаться современной технологией, она играет важную роль в облачных сервисах и виртуализированных средах, т.к. дает возможность модификаций топологии SAN без изменения текущей физической структуры. VSAN упрощает масштабирование ресурсов хранения для поддержки неустойчивых рабочих нагрузок и обеспечивает избыточность сети.  Если одна VSAN выходит из строя, службы переключают на другую в той же физической сети.

Интеллектуальное хранение

Постоянно растущие объемы гетерогенных данных требуют различной производительности, обслуживания и безопасности. В поисках ответов на эти вопросы поставщики постоянно внедряют интеллектуальные системы в предоставляемые решения хранения.  Интеллектуальное хранение использует искусственный интеллект и другие продвинутые технологии для проактивного управления системами, оптимизации производительности и решения потенциальных проблем до их возникновения.

Интеллектуальная система постоянно получает знания от своей среды и автоматически регулирует поведение.  Она собирает данные телеметрии от участвующих систем хранения, агрегирует и анализирует информацию, а затем использует ее для администрирования и оптимизации этих систем.  При эффективном внедрении решения интеллектуального хранения предоставляют бОльшую надежность, безопасность, использование ресурсов и производительность приложения.

Система интеллектуального хранения опирается на сложный механизм анализа, который использует технологии искусственного интеллекта: вычислительное обучение, глубокое обучение вместе с другими передовыми технологиями, включая прогностическую аналитику. Механизм определяет схемы и аномалии данных для прогнозирования проблем, предсказания трендов и определения затруднений производительности и т.д. В тоже время, механизм постоянно учится на основе собранных данных, что приводит к более точным прогнозам и в последствии к более эффективным системам хранения.

Решение интеллектуального хранения может автоматически прогнозировать результаты и предотвращать проблемы до их появления, принимая меры по оптимизации производительности рабочей нагрузки и гарантируя безопасность данных и их соответствие.  Оно предупреждает о проблемах конфиденциальности и о недостаточности места в хранилище, решет проблемы безопасности, помогает планировать емкость, распределяет ресурсы для виртуализированных рабочих нагрузок и т.д.

Поставщики по-разному внедряют интеллектуальные системы в решения хранения. Например, Hewlett-Packard Enterprises (HPE) предлагает интеллектуальное хранение через свой сервис InfoSight, который собирает данные телеметрии каждую секунду с миллионов датчиков систем, внедренных по всему земному шару.  InfoSight постоянно анализирует данные, затем применяет результаты этого анализа к индивидуальным системам клиентов.

Dell EMC использует другое решение, внедряя механизм машинного обучения напрямую в решения хранения и делая возможным принятие быстрых решений автономно, не полагаясь на постоянный внешний входной сигнал.  Механизм анализирует данные с локальных компонентов, используя усиленную модель обучения для быстрого решения проблем распределения.

Но у него нет незамедлительного доступа к текущей аналитике в отношении глобального массива данных.  У клиенты DELL есть доступ к службе CloudIQ, осуществляющей мониторинг, аналитику и выводы из обработки данных для устройств хранения DEll. Преимущество хранилища Dell в более быстром отклике, т.к. нет необходимости ждать ввода данных с внешнего сервиса.

«Вычислительное» хранение

В традиционной архитектуре вычислений и хранения данные свободно перемещаются между устройствами хранения и памятью компьютера, гди они обрабатываются в ответ на запросы приложения, сталкиваясь с некоторыми проблемами задержки и узкими местами сети.  Однако, такие современные рабочие нагрузки, как искусственный интеллект или аналитика больших данных могут столкнуться с проблемами производительности, т.к. порты ввода/вывода, расположенные между хранилищем и памятью имеют ограниченную пропускную способность и не могут соответствовать спросу в достаточном количестве, что приводит к узким местам, замедляющим время отклика.

Для решения подобной проблемы некоторые поставщики предлагают решения «вычислительного» хранения, которые перемещают часть обработки на платформу хранилища. Такой подход иногда называют обработкой на месте.  «Вычислительное» хранение сближает хранилище и вычислительные ресурсы на уровне хранилища, где данные могут быть предварительно обработаны со стороны сервера.  Это не только сокращает путь доступа к данным и поток трафика, но вычислительные компоненты также получают преимущество параллельной обработки, свойственных решению хранения, что приводит к еще более высокой производительности.

«Вычислительное» хранение потенциально может принести пользу любому приложению, чувствительному к задержкам, обрабатывающему большое количество данных.  Также оно подходит для сценариев пограничных вычислений и интернета вещей, где вычислительные ресурсы часто ограничены по размеру.  Например, Вы можете агрегировать массив данных на месте и затем отправить только агрегированные результаты в память сервера для дополнительной обработки.  Благодаря этому, Вы сокращаете количество данных, которые должны проходить через порты ввода/вывода, минимизируя воздействие вычислительных ресурсов, которые в свою очередь освобождают их для других рабочих нагрузок.

И хотя некоторые поставщики предлагают системы «вычислительного» хранения, эта область еще слишком молода.  Нередко приходится сталкиваться с проблемами интеграции из-за различий в реализации. Однако Ассоциация сетевых технологий хранения сделала попытку определения стандартов интерфейса для развертывания, управления и защиты устройств «вычислительного» хранения. 

Высокоскоростные энергонезависимые устройства хранения данных (SCM)

Другой современной технологией, порождающей множество слухов, является высокоскоростное энергонезависимое устройство хранения данных. Это тип памяти по скорости близкий к динамической оперативной памяти (DRAM), но, как и флэш - NAND энергонезависим. SCM имеет низкую стоимость байта (в отличии от DRAM) и по техническим характеристикам превосходит NAND. Он обладает большим сроком службы.

Эта технология также молода, но за ней большое будущее.  SCM также называют постоянной памятью, PMEM или P-MEM. Некоторые источники разделяют постоянную память и SCM, в зависимости от того, какая технология внедрена. Но такие несоответствия объяснимы для молодой области, но в конечном итоге отрасль выработает единую номенклатуру.

В центре споров вокруг SCM часто стоит идея новой ступени в иерархии памяти/хранения с модулями SCM, расположенными между DRAM и флэш-NAND. Подобно DRAM, устройство SCM обладает байтовой адресацией и может подключаться напрямую в область памяти сервера, обеспечивая эффективную поддержку чувствительным к задержкам приложениям, которым требуется больше памяти, чем может предоставить DRAM.

Устраняя разрыв между традиционной памятью и хранилищем, SCM делает возможным для приложений доступ к большим наборам данных через область системной памяти, в результате чего операции чтения и записи становятся значительно быстрее.  В тоже время, устройство SCM может поддерживать блочный доступ, как и флэш-NAND, обеспечивая большую гибкость, чем DRAM или NAND.

Изначально, основное внимание уделялось устройствам, которые можно использовать как кэш-хранилище или для замены флэш твердотельных накопителей SSD.  Intel возглавила эту работу со своей линейкой твердотельных накопителей Optane DC, которые работают во многом как твердотельные накопители NAND flash, но обеспечивают большую производительность.

Недавно Intel представил модули постоянно памяти Optane DC. Они подключаются напрямую к стандартным двухрядным слотам модуля памяти (DIMM). Модуль Optane может хранить до 512 Гб данных, что намного больше современного DRAM, хотя подобные показатели могут стать привычными для DRAM  в недалеком будущем.  Таким образом, модуль может быть уровнем хранения между DRAM и флэш NAND, приближая нас к оригинальному видению SCM.

Также возможно использование SCM вместо DRAM. хотя модули SCM медленнее, но возможность сохранения данных делает их подходящими в качестве самозагружаемых устройств.  Например, вы можете использовать SCM для рабочего сервера, который должен быть запущен как можно быстрее после запланированного или незапланированного перезапуска.

Конечно, количество современных технологий гораздо больше, чем описано в статье. Например, решение хранения 5D, которое использует сверхбыструю лазерную технологию для внедрения данных в кварцевое стекло. Решение 5D позволяет хранить до 360 ТБ данных на одном небольшом диске на протяжении более 13 миллиардов лет.

Технологии хранения постоянно развиваются. Несомненно, что объем данных будет расти, они будут становиться все более разнообразным, а рабочие нагрузки, обрабатывающие эти данные, будут все более сложными и интенсивными, предъявляя высокие требования к хранилищу. Технологии будущего должны будут принимать во внимание объем, сложность данных, обеспечивать безопасность и защиту информации от изощренных кибератак.

No Comments

Add a Comment