24.07.2018 Публикации
Как гуманитарию начать работать с данными
Несколько лет назад я столкнулся с казалось бы простой задачей и не смог её решить. Мне надо было проанализировать данные о продажах. Посмотреть структуру по городам, сопоставить с населением, с числом наших партнеров и партнеров конкурентов, найти зависимости и места, где получаем денег меньше, чем могли бы.
Тогда я не нашёл подходящих инструментов. Теперь они есть. Если быть точным, инструменты и раньше были. Но сейчас они стали доступны.
Я смотрел на заполненный цифрами лист Excel в ожидании озарения. Казалось, не хватает тайного знания о возможностях этой программы. Не один раз мелькала идея пойти на специальные курсы. Но сомнения в пригодности Excel взяли верх.
Я интересовался у коллег — а как у них. Коллеги пользовались тяжелыми ERP-системами. Однако, с аналитикой данных всё было примерно так же.
Сегодня автоматизация привела к тому, что даже у совсем маленьких компаний полно данных. Об искусственном интеллекте и Big Data говорит каждый утюг. Но работать с данными по-прежнему умеют лишь крупные организации.
Когда я смотрю очередной вебинар или тренинг — как что-нибудь посчитать или сделать со своими данными, мозг плавится от терминов, а настроение портится от осознания препятствий на пути в мир Data Sciense. Психологи называют это словом "фрустрация".
Менеджерам и маркетологам часто приходится ломать голову, как сделать ту или иную штуку — посмотреть зависимость или увидеть тенденцию. Но такие поиски иногда заканчиваются тупиком. Всё-таки привычные электронные таблицы создавались для другого.
Поэтому я решил создать серию видео-роликов. В каждом выпуске будет решение какой-нибудь задачки в области трансформации данных.
Я буду использовать профессиональный инструмент — Qlik. Точнее, его бесплатную версию — Qlik Sense Desktop. Когда-то это платформа была довольно сложной и дорогой. Чтобы воспользоваться, требовались знания в области Data Science и архитектуры BI-систем. В конце концов, надо было уметь писать скрипты. Однако, теперь всё стало проще.
Все шаги можно воспроизвести — либо на своих данных, либо на тестовом наборе.
Надеюсь, кому-то наша идея поможет немного сократить путь в мир данных.