Общие наборы данные Power BI

Tags: Power BI, PowerBI

Если вы тем или иным образом касаетесь Power BI, вы наверняка слышали о сертифицированных наборах данных, и о том, что общие наборы данных стали доступны в нескольких рабочих пространствах. В этой статье вы узнаете:

  • Что такое общий набор данных в Power BI?
  • Как общий набор данных может помочь в разработке Power BI?
  • Где находится общий набор данных в архитектуре Power BI?
  • Как работает общий набор данных в службе Power BI?
  • Что такое сертифицированные и продвигаемые наборы данных?

Что такое набор данных в Power BI?

Когда вы создаете отчет Power BI (или назовем его файлом * .PBIX), отчет состоит из двух компонентов (если режим подключения к данным - импорт данных); Отчет и набор данных. Когда вы находитесь в Power BI Desktop, вы не видите раздел под PowerPoint BIOS.

Когда вы находитесь в среде Power BI Desktop, вы не можете так легко увидеть разделение, пока не отправитесь в диспетчер задач и посмотрите как набор данных работает за сценой под потоками задач Power BI Desktop.

 

Однако, когда вы публикуете файл PBIX на веб-сайте Power BI, вы можете легко увидеть, что есть два объекта: Отчет (Report) и набор данных (Dataset).

 

  • Отчет представляет собой уровень визуализации вашей реализации Power BI
  • Набор данных содержит данные, таблицы, отношения, расчеты и подключение к источнику данных.

Вы можете запланировать обновление для набора данных и подключиться к локальным источникам (или через шлюз) или к облачным источникам.

 

Что такое общий набор данных?

Теперь, когда вы знаете о наборе данных, давайте поговорим об общем наборе данных. Общий набор данных это набор данных, разделенный между несколькими отчетами. В течение длительного времени вы можете создать новый набор данных на веб-сайте Power BI. Эта функция была доступна с первых дней Power BI;

 

Приблизительно в апреле 2017 года появилась возможность создать отчет из Power BI Desktop, который может указывать на существующий набор данных и иметь прямое соединение с существующим набором данных.

 

В те дни это называлось ”Get Data from Power BI service”. В настоящее время эта функция переименована в ”Get Data from Power BI Dataset”.

 

Общий набор данных - это набор данных, который совместно использует несколько отчетов. Несколько отчетов, соединяющихся с одним общим набором данных. Когда этот набор данных будет обновлен, все эти отчеты будут иметь новые данные. Общий набор данных на один шаг ближе к клиенту с несколькими разработчиками в среде Power BI.

 

Совместное использование наборов данных в нескольких рабочих пространствах

Долгое время совместное использование наборов данных было возможно только внутри рабочей области. Вы не могли использовать набор данных из рабочей области 2. Однако эта функция доступна, и вы можете совместно использовать набор данных даже в нескольких рабочих пространствах. Это удивительное обновление, которое меняет способ работы Power BI Works в будущем.

Когда вы получаете данные из набора данных Power BI через Power BI Desktop, вы должны выбрать, какой набор данных вы хотите получить из данных.

 

Как работает Shared Dataset за сценой?

Когда вы разделяете набор данных в одной рабочей области, все ясно. У вас есть один набор данных для планирования обновления и несколько отчетов, связанных с ним. Однако, когда вы используете набор данных, предоставленный в общий доступ из другого рабочего пространства, вы можете получить нечто другое.

Связанный набор данных

Когда вы получаете данные из набора данных Power BI из рабочей области 1, а затем сохраняете отчет в рабочей области 2, вы получаете что-то вроде копии вашего набора данных в рабочей области 2. Это может выглядеть странно! Вы можете сказать,что это не общий набор данных, это скопированный набор данных.  Дело в том, что вы видите только ссылку. Power BI перенесет ссылку на этот набор данных в новое рабочее пространство, эта ссылка поможет вам понять, когда набор данных обновлялся в последний раз.

 

Вот как выглядит связанный набор данных, и вы можете увидеть разницу между ним и обычными наборами данных.

 

Вы не можете вручную обновить или обновить связанный набор данных. Действие обновления может быть настроено только в основном наборе данных. Связанный набор данных - это просто ссылка, показывающая последнюю дату и время обновления, а также более простой способ создания большего количества отчетов из набора данных.

Связанный набор данных не является копией, это ссылка на исходный набор данных.

Сертифицированные и продвигаемые наборы данных

Когда разработчики Power BI используют набор данных Power BI, они видят все наборы данных из всех рабочих областей, к которым у них есть доступ. Это может немного запутать их. Там может быть тонны наборов данных в общей среде. Разработчик сталкивается с такими вопросами, как: Какой из них я могу использовать? Какие из них допустимы для использования? Какие из них согласованы и проверены? Какие из них надежны для использования? и т. д.

 В наборы данных Power BI добавлена новая система маркировки, что помогает в этом сценарии. Вы можете пометить некоторые наборы данных как сертифицированные и продвинутые. Чтобы получить сертификацию набора данных, существует процесс утверждения, который может гарантировать, что набор данных прошел некоторые тесты. С помощью этой системы маркировки вы можете уточнить, что такое наборы данных, а что нет. Вы можете создать концепцию наборов данных Gold, Silver и Bronze. Наличие наборов данных золота в качестве наборов данных, которые полностью протестированы и согласованы, а затем перешли на другие уровни, где набор данных Bronze является набором данных, который еще не был проведен ни в одном тесте.

Чтобы использовать эту систему маркировки, создатель набора данных может в настройки набора данных.

 

В настройках вы можете установить уровень одобрения (Endorsement), как показано ниже:

 

Как вы можете видеть, опция Certified может быть недоступна. Администратор клиента Power BI имеет полномочия для включения этой маркировки и дать необходимый доступ в Tenant Settings.

 

Система маркировки помогает разработчикам Power BI узнать, на каком уровне сертификации должен использоваться  набор данных в качестве общего набора данных, а затем выбрать его исходя из этого.

 

Общий набор данных в архитектуре Power BI

Использование потока данных гарантирует, что вы сможете хорошо подготовить данные в центральной области, которую можно назвать централизованным хранилищем данных в озере данных Azure. и используя общие наборы данных, вы можете создавать витрины данных, которые могут использоваться несколькими отчетами. Вот как схематически работает архитектура.

 

Вместо того, чтобы беспорядочно хранить силосы отчетов и файлов Power BI, вы можете создать архитектуру, которая лучше всего работает с несколькими разработчиками, с меньшей избыточностью данных, кода и логики, а также с более простым подходом к обслуживанию.

Резюме

Общий набор данных не является новой функцией в Power BI, однако возможность делиться им между несколькими рабочими областями, появилась недавно, и меняет игру в архитектуре реализации Power BI. Используя общий набор данных, вы можете иметь централизованные модели данных (витрины данных), которые могут обслуживать несколько отчетов. С помощью этого подхода вы можете сократить время обслуживания, избыточность кода и данных. Наличие системы маркировки сертифицированного или продвигаемого набора данных также является отличным способом внедрения некоторого процесса и управления для обеспечения того, чтобы общие наборы данных прошли через некоторый процесс тестирования и согласования.




No Comments

Add a Comment