Data Lake Озеро данных CRM-маркетинг Сегменты и DMP

Data Garage #2. Datalake (Озеро данных): что это и зачем бизнесу

Второй эпизод Data Garage. Разбираем, что такое озеро данных простыми словами: чем оно отличается от Data Warehouse и DMP, как вокруг цифрового профиля пользователя склеиваются сессии сайта и сделки из CRM, и зачем это малому и среднему бизнесу. Внутри — гиперсегментированные триггерные кампании, реальные кейсы (моторы для лодок, фермер с мясом, мотосервисы по Ducati) и почему за 3 500 ₽ в месяц вы получаете собственный Data Lake вместо самописной CRM за 3 миллиона.

⏱ ~61 мин · диалог хостов Data Garage

⏱ Навигация

Хосты Data Garage

Команда PrimeGate

Второй эпизод гаражного эфира Data Garage ведут двое: владелец бизнеса и маркетолог PrimeGate. Один смотрит на инфраструктуру глазами собственника (продажи, СLЗы, одно окно коммуникаций), второй — глазами маркетолога (сквозная аналитика, сегменты, матчинг). Разбирают на практике, что такое озеро данных для малого и среднего бизнеса и почему PrimeGate по факту является Data Lake.

42%инфляция цены клика 2018-2021
5каналов триггерных кампаний
3500₽свой Data Lake в месяц
3составляющих инфраструктуры

Ключевые инсайты

6 тезисов про озеро данных

💧

Data Lake — хранилище вокруг цифрового профиля

Это не «большие данные про чипы и температуру». Для маркетинга озеро данных — сессии сайта, склеенные с CRM-сделками в единый профиль конкретного пользователя.

🧾

Зачем оно: сегменты для активностей

В озере хранятся сегменты пользователей, нарезанные по событиям сайта и условиям CRM. Их можно выгружать в платную рекламу или запускать на них триггерные кампании.

📱

5 каналов вместо дорогого клика

SMS, push, email, звонки, онлайн-чат и мессенджеры. SMS за 6 ₽ дешевле клика ремаркетинга. Это работа над retention, а не над первичным трафиком.

💰

Раньше — SAP, теперь — 3 500 ₽

Озеро данных могли позволить только крупные бренды с ERP. Сейчас тариф PrimeGate за 3 500 ₽ в месяц — это уже Data Lake с сессиями, CRM и колл-трекингом.

🎯

Сегмент в Data Lake матчится точнее

Яндекс ограничен в матчинге (16-24 дня). Если собрать сегмент в озере и передать его, вероятность корректной склейки выше, чем в реальном времени на стороне рекламной системы.

🏗

Сначала инфраструктура, потом озеро

100% обращений, счётчик на сайте, статусы CRM. Если данные где-то отваливаются — не будет ни отчётов, ни сегментов. Не пилите своё за 3 млн — берите готовое.

Ваша карточка на Яндекс.Картах теряет клиентов?

AI-аудит RecPlace по 34 параметрам — бесплатно. Покажет, где упускаете трафик и деньги

Получить аудит →
Data Lake CRM-маркетинг Сегменты

Datalake (озеро данных): что это и зачем бизнесу простыми словами

Второй эпизод передачи Data Garage целиком посвящён озеру данных. Хосты сразу честно признают: если искать в сети, озером данных называют всё что угодно — от массивных хранилищ для производства, где оцифровывают температуру и чипы, до маркетинговых хранилищ, собирающих куки. Поэтому начинают с того, что Data Lake значит конкретно для них и для малого и среднего бизнеса.

«Озеро данных — это хранилище, в котором есть максимальное количество данных, но, как правило, они вокруг цифрового профиля пользователя. То есть это данные, которые содержат сессии вашего сайта, объединённые с CRM-системой — со сделками, с привязкой к конкретному пользователю».

— Хосты Data Garage

Важная оговорка: речь не про те большие озёра данных, которые имеет в виду, например, Huawei. В массовом сегменте Data Lake делается для одной приземлённой цели — чтобы можно было автоматизировать маркетинг. Это в первую очередь хранилище маркетинговых и коммерческих данных.

Что хранится в озере данных

По мнению хостов, в озере данных хранятся сегменты пользователей. Вы можете отсегментировать их по событиям на сайте, по условиям из биллинга (если у вас SaaS), или по условиям из CRM-системы. Проблема в том, что большинство CRM-систем не позволяет сегментировать пользователя так, как нужно.

По чему нарезаются сегменты

  • По событиям на сайте. Например, пользователь пришёл из определённого города — это хранится в веб-аналитике.
  • По событиям в CRM. Сделки со средним чеком, сделки в определённой товарной категории или номенклатуре.
  • По «и/или». Только сайт, только CRM, либо комбинация обоих источников сразу.

Data Lake, Data Warehouse и DMP — в чём разница

Кроме озера данных есть Data Warehouse, сервисы оркестрации (коннекторы, которые складывают в одну базу данные из других баз) и DMP. Грань тонкая, и хосты её проговаривают прямо.

«Есть некое разграничение: есть озеро данных, а есть DMP — Data Management Platform, платформа управления данными. Иногда это в одном сервисе, иногда в разных. Платформа пользовательских данных отличается от Data Lake тем, что есть возможность нарезать сегменты».

— Хосты Data Garage

Зачем нужен Data Lake

Ответ прямой: чтобы запускать разные маркетинговые активности. Сегменты пользователей можно выгружать в платные рекламные сервисы — Яндекс.Аудитории, Mail, Google, VK. Но бесплатная веб-аналитика вроде Яндекс.Метрики создаёт сегменты не всегда корректно и не позволяет выгрузить все нужные данные.

«У нас огромное количество звонков, которые сводятся к тому, что Метрика считает звонком нажатие на номер телефона, что звонком не является. И списывает за это деньги. А сегмент, который базируется на таком событии, оказывается некорректным».

— Хосты Data Garage

Вторая, недооценённая часть — бесплатные каналы. Собрали сегмент и отправили его в рассыльщик, чтобы запустить не контекстную рекламу в прямом аукционе, а гиперсегментированный контент-маркетинг, SMS-маркетинг или триггерные сообщения на сайте.

Пять каналов вместо борьбы за дорогой клик

Зацикленность на первичном трафике — главная ловушка. Инфляция цены клика с 2018 по 2021 год составила 42%, а после 2021-го клик «взлетел в несколько раз». Качественный клик за 15 ₽ сейчас можно найти только в супермассовой тематике вроде книг или FMCG; в B2B средний клик 30-40 ₽ — реальность, с которой живёт основная масса клиентов PrimeGate.

Каналы триггерных гиперсегментированных кампаний

  1. SMS. Не дозвонился в компанию — отправили SMS. Даже за 6 ₽ это дешевле клика ремаркетинга.
  2. Push и сообщения на сайте / в приложении.
  3. Email-сообщения.
  4. Телефонные звонки. Напоминание о брони в отеле, записи в автосервис — «колоссально поднимает конверсию».
  5. Онлайн-чат и мессенджеры. «Привет, ты пришёл из Южного Бутова, ближайший к тебе автосервис — на такой-то улице».

«Я бы не стал ограничивать это CRM-маркетингом, это больше Data Lake-маркетинг. Это работа над retention, над удержанием пользователя, над вовлечением пользователя. А за это платить не нужно — как только компания начинает думать о таких кампаниях, конверсия у бизнеса сразу увеличивается».

— Хосты Data Garage

Почему PrimeGate — это Data Lake

«Если у вас вообще есть Data Lake, значит, вы озаботились тем, чтобы начать собирать данные. PrimeGate в данном случае и есть Data Lake. Это Data Lake, в котором есть сессии вашего сайта. Все, кто приходит на сайт, объединяются вокруг юзера, а потом, попадая в CRM, склеиваются в цифровой профиль».

— Хосты Data Garage

Главная идея: объединить CRM-маркетинг с классической веб-аналитикой. Поэтому это называют не веб-аналитикой и не триггерными сообщениями, а именно Data Lake. И начинать предлагают не с конечной точки («мне нужны авторассылки или SMS»), а с озера данных и формирования сегментов.

Модуль «Сегменты» и матчинг рекламных систем

В новой версии Prime сегменты выделяют в отдельный модуль — конструктор, который гибко фильтрует пользователей по множеству критериев, неважно, оставили они лид или нет. После фильтрации решение: отправить в сервис автоматизации (SMS, письма) или в платную рекламу.

«Когда мы сформировали в Data Lake сегмент и отправили его в Яндекс, вероятность того, что он склеится правильно, выше, чем если это будет происходить в режиме реального времени в Яндексе. У Яндекса есть ограничения в матчинге — 16 или 24 дня. Когда больше типов данных в Data Lake, у системы больше возможности всё корректно склеить».

— Хосты Data Garage

1Кейс: моторы для лодок во Владивостоке

У PrimeGate был клиент во Владивостоке — интернет-магазин лодочных моторов. По цифровому профилю было видно: человек приходит по запросу крутого мотора, сидит на нём 40 минут, лазит по разным моторам, а потом покупает масло для другого мотора — видимо, чтобы проверить доставку.

«Когда менеджеры начали смотреть историю, они поняли, что клиент пришёл вообще за другим. И появилась возможность по-другому вести диалог. Цифровой профиль — это для нормального отдела продаж просто кладезь».

— Хосты Data Garage

Дальше — автоматизация. Не все звонят, поэтому таким пользователям можно написать в онлайн-чат спецпредложение или дать характеристику мотора. А тем, кому нужно время «созреть», — выстроить воронку дожима: добавить в сегмент, передать через Data Lake в Яндекс и показать набор баннеров про гарантию и запчасти для конкретного мотора.

2Кейс: триггерный чат по городу (колл-трекинг, 2016)

В колл-трекинге в 2016 году люди не звонили, потому что видели «московские» номера и не знали, есть ли услуга в их регионе. Решение — триггерный чат, который сам писал: «Привет! У нас есть номера для Владивостока. Есть номера для Южно-Сахалинска».

«Это обычный триггерный чат, ничего супер, никакого rocket science. Но чтобы эта штука сработала, чат должен откуда-то взять данные города. Ему нужна база данных. А озеро данных, по сути, это и есть структурированная база данных ваших пользователей — только чуть больше, чем CRM, потому что CRM не хранит куки».

— Хосты Data Garage

Карточка вашего бизнеса теряет клиентов?

AI-аудит RecPlace по 34 параметрам — бесплатно

Получить аудит →

Раньше — только крупные бренды, теперь — 3 500 ₽

«Раньше Data Lake могли позволить себе только крупные бренды, которые внедряли SAP и большие ERP. А сейчас Data Lake — это PrimeGate: вы покупаете тариф за 3 500 ₽ и получаете не только модули для сбора лидов и повышения конверсии, но и CRM-систему, и колл-трекинг. Мы называем это инфраструктурой или операционной системой для бизнеса. И автоматически это является Data Lake».

— Хосты Data Garage

Чем раньше поставите этот Data Lake — тем больше накопите данных.

3Кейс: мебельный ТЦ и фермер с мясом

Крупный мебельный торговый центр использовал Prime нестандартно — искали 404-ошибки на новом сайте. По цифровому профилю было видно, как люди упираются в пустые ссылки, возвращаются стрелкой, снова переходят и уходят. На основе этого составили большое ТЗ на корректировки.

Другой кейс — фермер, продающий мясо B2B (порядка 700-900 особей). Под Новый год часть предзаказов отвалилась, клиенты боятся звонить из чувства вины. У него нет CRM, всё записано в книжке, и нет времени обзванивать сотню заказчиков по всей России.

«Если бы можно было взять сегмент пользователей, которые покупали за 22-й год, и сделать автоматический звонок — просто воспроизвести запись „Привет, меня зовут так-то“, — я бы мог вернуть очень много людей».

— Со слов клиента-фермера

4Кейс: мотосервисы и Ducati

Специфика мотосервисов: летом завал и очереди на две недели, а зимой — пусто. Проблема легко решается рассылками. У топовых моделей есть обязательные работы — например, поменять ремни раз в пять лет или при определённом пробеге.

«Если бы мне пришло сообщение: „Привет, помнишь, что нужно поменять ремни? Вот комплект, нажми „да“ — мы перезвоним и запишем тебя, пока не начался мотосезон“. И никто этого не делает. А не делают, потому что нет датлэйка — и потому, что из автоматизации сделали гидру, якобы недоступную малому бизнесу».

— Хосты Data Garage

Инфраструктура: три составляющих озера данных

Чтобы наполнить озеро данных, нужна не команда дорогих сотрудников, а инфраструктура. По сути — инфраструктура сквозной аналитики: оцифровка и подключение всех каналов прямого обращения, от виртуальной АТС до онлайн-чатов, мессенджеров, форм сайта и квизов. Сам сайт — тоже часть, он собирает «мякотку» видеосессий. Плюс данные CRM и ERP: продажи, производственные и логистические цепочки.

Три обязательные составляющие

  1. Собрать 100% обращений по всем каналам. Если не трекаем обращения — теряем сегменты и просто теряем лиды.
  2. Счётчик на сайте, который связывает сессии пользователя.
  3. CRM-система и её статусы, привязанные к статусам в Data Lake и к цифровому профилю.

Маркетолог добавляет к этому ERP и визуализацию отчётов с интерфейсами для настройки автоматизации. Важно: в бесплатной веб-аналитике нет долговременного хранения — выгрузить из неё всё это нельзя, а из Data Lake можно.

Не изобретайте велосипед: самописная CRM за 600 тыс. и за 3 млн

«Если вы малая или средняя компания и у вас нет условных 3-5 миллионов в месяц на штат, который будет содержать инфраструктуру, — не надо изобретать велосипед, берите готовое. Инвестиции, которые требуются для поддержания IT-инфраструктуры, несопоставимы с результатом, который вы получите».

— Хосты Data Garage

Реальный пример: знакомый обещал за 600 тысяч поднять не CRM, а CRM + сценарии автоматизации (ERP). По факту такое нельзя сделать даже за 3 миллиона — это можно «напилить, подписать акт, и через неделю это сломается». На рынке есть целое направление: самописные CRM за 2-3 млн, после которых клиент «сидит на компании без возможности уйти», плюс платит за поддержание.

«Чем хорош SaaS? За разработку вы не платите, либо платите за разработку, но не за поддержание. SaaS всасывает в себя ваш модуль и берёт его на гарантию. Интеграцию с AmoCRM или Битриксом мы поддерживаем раз десять в месяц — у каждого клиента свой кейс, и периодически что-то меняется на стороне самих систем».

— Хосты Data Garage

5Кейс: 1С и интеграция за полмиллиона

Показательный пример с точки зрения озера данных. Российская компания с 1С в качестве CRM. Партнёр-интегратор сделал модуль «лидогенерация», который должен забирать данные из сквозной аналитики и возвращать статусы сделок. Есть открытая API Prime, готовность доработать её за адекватные деньги, интегратор и клиент.

«Но даже такая простая штука — взять данные из Prime, положить в систему и отдать обратно изменение статуса в CRM, сумму и название сделки — не работает. Это самая базовая интеграция, без всякой автоматизации, просто коннектор обмена данными. Интеграцию с PrimeGate на рынке продают от полумиллиона — и ничего не работает».

— Хосты Data Garage

Четыре уровня абстракции PrimeGate

За 3 000 ₽ вы получаете не просто CRM или колл-трекинг, а разноуровневую инфраструктуру, которую очень тяжело поддерживать самостоятельно. На неё можно смотреть как минимум с четырёх сторон:

Как смотреть на Prime

  • Маркетинговая инфраструктура. Сквозная аналитика, сегменты, выгрузки в рекламу.
  • Инфраструктура, наполняющая CRM. Email tracking как инструмент агрегации, который аккуратно кладёт данные в CRM.
  • Инструмент обработки. Модуль Supercharger — одно окно всех коммуникаций: почта, чат, Telegram плюс отчёты.
  • Data Lake. Четвёртый уровень — база, без которой все «прикольные сервисы» превращаются в головную боль.

Что забрать с собой

  1. Озеро данных = цифровой профиль. Сессии сайта, склеенные с CRM-сделками вокруг конкретного пользователя.
  2. Data Lake ≠ DMP. DMP отличается возможностью нарезать сегменты по разным условиям.
  3. Цель — автоматизация маркетинга. Сегменты выгружаются в рекламу или в триггерные кампании.
  4. 5 каналов вместо дорогого клика. SMS, push, email, звонки, чат/мессенджеры — это работа над retention.
  5. Матчинг точнее из озера. Сегмент, собранный заранее, склеивается надёжнее, чем в реальном времени.
  6. 3 500 ₽ вместо SAP. Тариф PrimeGate — это уже Data Lake с сессиями, CRM и колл-трекингом.
  7. Сначала инфраструктура. 100% обращений, счётчик, статусы CRM — иначе ни отчётов, ни сегментов.
  8. Не пилите своё. Самописка за 3 млн ломается; берите готовый SaaS на гарантии.

Вопросы и ответы

FAQ про озеро данных и Data Lake

Что такое озеро данных (Data Lake) простыми словами?

+
Для маркетинга это хранилище с максимальным количеством данных вокруг цифрового профиля пользователя. В нём сессии вашего сайта объединены с CRM-системой: сделки привязаны к конкретному пользователю и его сессиям. По сути это структурированная база данных ваших пользователей — только чуть больше, чем CRM, потому что CRM не хранит куки. Речь именно про маркетинговые и коммерческие данные, а не про «большие озёра» уровня Huawei.

Чем Data Lake отличается от Data Warehouse и DMP?

+
Кроме озера данных есть Data Warehouse, сервисы оркестрации (коннекторы, складывающие данные из разных баз) и DMP — Data Management Platform, платформа управления данными. Главное отличие DMP от Data Lake — возможность нарезать сегменты пользователей по разным условиям. Иногда это один сервис, иногда разные. PrimeGate позиционируют и как Data Lake, и как DMP, потому что в новой версии появляется конструктор сегментов.

Зачем озеро данных малому и среднему бизнесу?

+
Чтобы автоматизировать маркетинг и запускать гиперсегментированные кампании. Первичный трафик дорожает: инфляция клика 2018-2021 составила 42%, в B2B средний клик 30-40 ₽. Озеро данных позволяет работать над retention — отправлять SMS, push, email, звонки, сообщения в чат и мессенджеры по точным сегментам. SMS за 6 ₽ дешевле клика ремаркетинга, и за такие каналы не нужно платить в аукционе.

Почему сегмент из Data Lake матчится точнее, чем в Яндексе?

+
У Яндекса есть ограничения в матчинге — порядка 16-24 дней. Когда вы сформировали сегмент в Data Lake и передали его готовым, вероятность корректной склейки выше, чем когда это происходит в реальном времени на стороне рекламной системы. Чем больше типов данных накоплено в озере, тем больше у Яндекса возможностей всё склеить правильно, а у вас — корректно эти данные передать.

Сколько стоит собственное озеро данных?

+
Раньше Data Lake могли позволить только крупные бренды, внедрявшие SAP и большие ERP. Сейчас тариф PrimeGate от 3 500 ₽ в месяц — это уже Data Lake: сессии сайта, CRM-система, колл-трекинг, модули для сбора лидов и повышения конверсии. Хосты называют это операционной системой для бизнеса. Чем раньше поставите такой Data Lake — тем больше данных накопите.

Что нужно, чтобы наполнить озеро данных?

+
Не дорогие сотрудники, а инфраструктура сквозной аналитики. Три обязательные составляющие: собрать 100% обращений по всем каналам (иначе теряются сегменты и лиды); счётчик на сайте, связывающий сессии пользователя; CRM-система со статусами, привязанными к цифровому профилю. Маркетолог добавляет ERP и визуализацию отчётов. Важно: бесплатная веб-аналитика не хранит данные долго и не позволяет всё это выгрузить, а Data Lake — позволяет.

Стоит ли заказывать самописную CRM вместо готового сервиса?

+
Если у вас нет 3-5 миллионов в месяц на штат для поддержания инфраструктуры — берите готовое. В видео разбирают кейс: знакомый обещал за 600 тыс. поднять CRM + сценарии автоматизации, но это нельзя сделать даже за 3 млн — «напилят, подпишут акт, через неделю сломается». Самописки за 2-3 млн привязывают клиента без возможности уйти и требуют дорогого поддержания. SaaS берёт доработки на гарантию, и вы не платите за поддержание.
Ваш бизнес теряет клиентов на картах? — Проверьте за 90 секунд Бесплатный аудит
Получите бесплатный аудит прямо сейчас!
Введите название Вашей компании так, как оно указано на Яндекс.Картах (без «ООО»), и город. Затем выберите из списка.
*как на Яндекс Картах + город, без ООО. И выберите свою компанию из списка
Получить бесплатный аудит
Куда прислать аудит? (Ожидание около 3 минут)
Ваша роль в компании
Предприниматель
Маркетолог

Благодарим Вас!

Пришлём результаты аудита в течение 3х минут в мессенджер.

А пока ждёте, посмотрите короткий обзор лучших практик по выводу Вашего бизнеса в ТОП на картах.