- Sources – слой источников данных
Данные поступают в хранилище из разных источников — CRM, ERP, веб-сервисов, сенсоров, Excel-файлов, БД и других.
- Ingestion and Transport – передача и наполнение
Слой обеспечивает доставку данных из источников в хранилище данных. На нем осуществляется репликация данных, real-time сценарии загрузки, оркестрация дата-пайплайнов и Reverse ETL - процесс обратного перемещения преобразованных данных в операционные инструменты и бизнес-приложения.
- Storage – слой хранения данных
Непосредственно Data Warehouse (DWH) и (или) Data Lake, Data Lakehouse хранилища данных. Storage oбъединяет структурированные данные в единую версию правды для последующей аналитики, Data Science или ML.
- Query and Processing – запросы и вычисления / обработка по запросу
Слой, в котором осуществляются аналитические запросы, ad-hoc обработка, выполнение SQL/ML-запросов в моменте
- Transformation - трансформация данных
Слои, в которых осуществляются операции изменения структуры и содержания данных: очистка, нормализация, агрегация, объединение
- Analysis & Output Layer – потребители данных
Инструменты для предоставления данных в удобной, понятной для пользователя форме BI-дашбордов, отчетов, визуализаций. Доставка ML-инсайтов в продуктовые или операционные системы.
- Уровень поддержки, управления и контроля - Data Governance, Data Discovery, Data Observability, Entitlements & Security
Интегрируется со всеми уровнями архитектуры — от хранения до аналитики, и обеспечивает:
- Соответствие политике безопасности
- Соблюдение регуляторных требований (GDPR, Закон О персональных данных)
- Мониторинг, алертинг, формирование data lineage
- Контроль качества данных и доступов