Microsoft Fabric надає можливість інтеграції даних Azure Cosmos DB через функцію дзеркального відображення (mirroring), яка наразі знаходиться у попередній версії. Ця функція дозволяє реплікувати дані з Azure Cosmos DB у сховище даних Fabric OneLake майже в режимі реального часу без необхідності використання ETL-процесів і без впливу на продуктивність транзакцій або витрат одиниць запитів (RU) у Cosmos DB.
Основні можливості дзеркального відображення Cosmos DB у Microsoft Fabric
-
Реплікація даних в OneLake: Дані Cosmos DB автоматично реплікуються в OneLake у форматі Delta Lake з відкритим кодом, що забезпечує сумісність з різними аналітичними інструментами всередині Fabric і поза ним.
-
Безшовний доступ до даних: Після реплікації дані доступні для аналітики через Power BI у режимі DirectLake, а також можна використовувати T-SQL для складних агрегатних запитів, Spark для аналізу та машинного навчання, а також записні книжки для створення моделей.
-
Автоматичне створення аналітичних об’єктів: Під час дзеркального відображення створюються три ключові елементи — сама дзеркальна база даних з керуванням реплікацією, кінцева точка аналітики SQL і семантична модель за замовчуванням, що спрощує роботу з даними та їх аналіз.
-
Підтримка змін схеми та вкладених даних: Дзеркалювання автоматично адаптується до змін у структурі даних Cosmos DB — нові властивості додаються як нові стовпці, а вкладені JSON-дані можна розширювати за допомогою T-SQL функцій, таких як OPENJSON.
-
Гнучкість у розгортанні: Дзеркальне відображення підтримує реплікацію однієї бази даних у кількох робочих областях Fabric, а також вибір регіонів Azure Cosmos DB для мінімізації затримок реплікації.
Налаштування та використання
Для використання дзеркального відображення необхідно:
-
Мати обліковий запис Azure Cosmos DB для NoSQL з увімкненою безперервною резервною копією.
-
Створити або використати існуючу ємність Microsoft Fabric.
-
У порталі Fabric створити дзеркальну базу даних, вказавши вихідну базу Cosmos DB для реплікації.
Після налаштування можна:
-
Запитувати дані вихідної бази Cosmos DB у режимі лише для читання через портал Fabric, використовуючи SQL-запити.
-
Виконувати аналітичні запити до дзеркальної бази даних в OneLake за допомогою T-SQL, об’єднувати дані з кількох контейнерів і використовувати їх для BI та ML-завдань.
Переваги використання Cosmos DB у Microsoft Fabric
-
Відсутність необхідності у складних ETL-процесах для інтеграції даних.
-
Економія ресурсів Cosmos DB завдяки мінімізації використання одиниць запитів.
-
Єдиний аналітичний простір, що об’єднує дані з Cosmos DB та інших джерел у Fabric.
-
Підтримка сучасних аналітичних сценаріїв із використанням Power BI, Spark, AI-інструментів і записних книжок.
-
Можливість масштабованого і гнучкого побудови архітектури даних із використанням відкритих форматів і стандартних інструментів Microsoft.
Отже, інтеграція Azure Cosmos DB з Microsoft Fabric через дзеркальне відображення надає потужний і зручний спосіб організації аналітики на даних NoSQL із мінімальними накладними витратами та високим рівнем автоматизації. Ця можливість особливо корисна для організацій, які прагнуть об’єднати операційні та аналітичні дані в єдиному сучасному аналітичному ландшафті.