Корпоративное хранилище данных DWH и BI-платформа - взаимодополняемые компоненты зрелой аналитической системы.
DWH консолидирует текущие и исторические данные, приводит к единому виду и готовит для аналитики. BI превращает эти данные в наглядные дашборды и понятные бизнесу визуализации, чтобы решения принимались быстрее и увереннее каждым пользователем. В связке DWH +BI могут дать максимальный эффект от работы с данными.
В статье разберем, кому подойдет внедрение DWH +BI, и какие этапы обычно проходит проект. Ответим на частый вопрос, возникающий у бизнеса на старте: что важно подготовить перед внедрением в компании, чтобы аналитическая система действительно начала работать на вас.
DWH (Data Warehouse, корпоративное хранилище данных) – централизованная система, которая консолидирует данные из разных источников (1С, Excel, CRM, ERP, БД, WMS, HRM, личных кабинетов маркетплейсов и других), очищает их и структурирует для аналитики.
Зачем корпоративное хранилище данных нужно бизнесу:
Какие задачи бизнеса помогает решить корпоративное хранилище данных?
Отличие DWH от транзакционных БД и Excel
В банках, ритейле, телекоме и других отраслях данные об операционной деятельности хранятся в виде транзакций (ACID) в CRM, кассовых и ERP-системах. В основе этих систем лежат транзакционные базы данных, такие как MySQL, PostgreSQL, Oracle DB, MS SQL Server.
Транзакционные БД предназначены для быстрой записи и изменения текущих данных, необходимых для функционирования определенной системы, но не способны хранить и обрабатывать исторические данные.
Часть данных в компании, как правило, также существует в виде таблиц Excel, но инструмент предполагает исключительно ручные выгрузки, в которых формулы и логика расчетов не всегда прозрачны.
При этом Excel чаще всего используется как локальное решение: внутри компании одновременно могут существовать десятки и даже сотни копий одних и тех же таблиц у разных сотрудников. В таких условиях практически невозможно обеспечить единый формат данных, контроль их качества и соответствие требованиям безопасности и комплаенса. Excel предполагает ручное управление данными, что увеличивает вероятность ошибок и влияния человеческого фактора.
Иногда альтернативой становится Google Sheets — по сути облачная версия Excel, которая немного упрощает совместную работу, но не решает ключевые проблемы управления данными, версионности и администрирования.
DWH способно объединить данные из транзакционных БД, Excel-файлов и других источников, агрегировать их, обрабатывать и очищать, отслеживать изменения атрибутов и значений во времени для поддержки историчности.
Данные из хранилища подходят как для простых аналитических запросов, так и для многомерного анализа, регламентной отчетности, прогнозирования, исследования данных и проектов Big Data.
Кроме того, данные из хранилищ отдельных подразделений могут автоматически передаваться в корпоративное DWH головной компании. Такой подход особенно актуален для крупных холдингов, банковских групп с дочерними организациями, а также международных компаний с распределенной структурой управления.
К таким платформам относятся, например, Qlik, FineBI, PIX BI, AW BI, Insight BI.
На уровне корпоративной аналитической системы BI — это слой потребителей данных, который обеспечивает автоматизацию формирования отчетности и визуализацию показателей. Источником данных для BI выступают витрины данных в DWH.

Но внедрение DWН необходимо не каждой компании.
Внедрение DWH+BI необходимо в компаниях со сложной структурой и большим количеством информационных систем, где анализ осуществляется на пересечении различных подразделений и процессов.
Малый и средний бизнес, а также компании, деятельность которых ограничена повторяющимися, простыми операциями, могут обойтись корректно внедренными и настроенными дашбордами в BI.
Проект внедрения корпоративного хранилища данных и BI-системы обычно проходит несколько последовательных этапов, что позволяет постепенно сформировать архитектуру аналитической платформы, обеспечить качество данных и подготовить систему к реальной работе бизнеса.
Ниже - путь, который повторяется в большинстве проектов внедрения DWH от Qlever, от обследования до запуска, с обязательной бизнес-валидацией на каждом шаге.
На этом этапе важно понять, какие задачи бизнеса должна решать аналитика и какие данные для этого необходимы.
Основные работы этапа:
Результаты этапа:
После согласования требований начинается подготовка технологической платформы, на которой будет построена аналитическая система.
На этом этапе выполняются следующие задачи:
Результаты этапа:
На этапе проектирования формируется структура аналитической платформы и модель данных, на которой будет строиться вся дальнейшая аналитика.
Ключевые задачи этапа:
Результаты этапа:
Основная задача этого этапа — организовать интеграцию источников данных и подготовить данные для аналитики.
Основные работы:
Результат этапа — готовое корпоративное хранилище DWH, которое служит единым источником данных для BI-аналитики.
Ключевые задачи этапа:
В результате пользователи получают доступ к BI-отчетам, построенным на основе данных из DWH.
В компании создана единая аналитическая платформа для работы с данными.
Перед окончательным запуском система проходит этап опытной эксплуатации.
На этом этапе:
После успешного тестирования выполняется публикация BI-приложений в продуктивной среде и запуск аналитической системы для всех пользователей компании.
Заключительный этап проекта направлен на подготовку сотрудников к работе с новой аналитической системой.
Основные работы: