Что такое хранилище данных?

Tags: DataWarehouse, хранилище данных

Согласно Википедии, хранилище данных это:

 

В цифровой индустрии, хранилище данных (DW или DWH), также известное как хранилище данных предприятия (EDW), представляет собой систему, используемую для отчетности и анализа данных. DW являются центральными хранилищами интегрированных данных из одного или нескольких разрозненных источников. Они хранят текущие и исторические данные и используются для создания аналитических отчетов для работников умственного труда на предприятии. Примеры отчетов могут варьироваться от ежегодных и квартальных сравнений и трендов до подробных ежедневных анализов продаж.

Данные, расположенные в хранилище, загружаются из операционных систем (например, маркетинг, продажи и т. д., показанные на рисунке внизу). Данные могут проходить через хранилище оперативных данных для дополнительных операций до того, как они будут использоваться в DW для отчетности.



В начале девяностых Билл Инмон придумал термин хранилище данных, определяя его, как:

 

Предметно-ориентированное, интегрированное, привязанное ко времени, неизменяемое скопление данных для поддержки решений руководства.


С другой стороны, Ральф Кимбалл  более емко определяет хранилище данных, как:

Копия  транзакционных данных, структурированных специально для запроса и анализа.


Ральф Кимбалл раскрывает определение с помощью требований:

  • Хранилище данных обеспечивает доступ к корпоративным или организационным данным.
  • Данные в хранилище согласованы.
  • Данные в хранилище можно разделить и объединить с помощью всех возможных мер в бизнесе (требование классического "анализа вдоль и попёрек"),
  • Хранилище данных - это не просто данные, но также набор инструментов для запроса, анализа и представления информации.
  • Хранилище данных - это место, где мы публикуем используемые данные.
  • Качество данных в хранилище данных является драйвером реинжиниринга бизнеса.

Согласно Википедии, витрина данных:

Витрина данных - срез хранилища данных, представляющий собой массив тематической, узконаправленной информации, ориентированный, например, на пользователей одной рабочей группы или департамента.

Витрины данных представляют собой небольшие фрагменты хранилища данных. В то время как хранилища данных имеют глубину всего предприятия, информация в витринах данных относится к одному отделу. В некоторых развертываниях каждый отдел или подразделение считается владельцем своего хранилища данных, включая все оборудование, программное обеспечение и данные. Это позволяет каждому подразделению использовать, манипулировать и разрабатывать свои данные по своему усмотрению; без изменения информации внутри других витрин данных или хранилища данных. В других вариантах развертывания, в которых используются соответствующие измерения, это право собственности на бизнес-единицы не распространяется на общие параметры, такие как клиент, продукт и т.д.

No Comments

Add a Comment