Проект

Общее

Профиль

Поддержка #10870

RFMCD подход. Внедрение в Куб Миницен

Добавил(а) Елена Евсевлеева больше 1 года назад. Обновлено около 1 месяца назад.

Статус:
В работе
Приоритет:
Обычный
Категория:
Разработка
Дата начала:
29.08.2024
Дата завершения:
28.11.2025
Готовность:

20%


Описание

Добрый день!
Планируем добавлять к текущей модели сегментации новый подход RFMCD, который можно будет заложить в сегментаторы, в saas аналитику и в проекты кубов для аудита и разработки стратегии.
Начнём с простого, с куба Миницен.
Суть подхода для сегментации клиентов:
Recency - кол-во дней с даты последней покупки
Frequency - кол-во чеков
Monetary - сумма трат
Consistency (регулярность) - среднее кол-во дней между покупками
Diversity (ширина корзины) - кол-во приобретенных категорий товара

Необходимо сделать разработку и добавить в Куб Миницен новые измерения:
1. C (регулярность). Дней между покупками
Дней между покупками = (Дата последней покупки - Дата первой покупки за последние 365 дней) / (Кол-во чеков за последние 365 дней - 1)

2. D (ширина корзины).Кол-во купленных категорий 2 уровня
Определяется для каждого ИД клиента за период 12 месяцев. Не учитывается категория NULL

Далее посмотрим распределение клиентов и экспертно определим границы измерений для добавления в Куб интервалов и распределения клиентов по группам в рамках этих границ.

скрин.docx (280 КБ) Елена Евсевлеева, 24.12.2024 08:39

проверка 09.01.25.xlsx (177 КБ) Елена Евсевлеева, 09.01.2025 07:06

Сверка 01.09.25.png (115 КБ) Preview Елена Резинкина, 01.09.2025 13:33

22799

Повторениеs

История

#1 Обновлено Иван Щесюк больше 1 года назад

  • Параметр Дата завершения изменился на 10.09.2024
  • Параметр Статус изменился с Новая на В работе
  • Параметр Назначена изменился с Иван Щесюк на Наталья Фролова
  • Параметр Готовность изменился с 0 на 20

Привет.

Наташа, возьми в работу.
Если возникнут вопросы, то Лена и Юля помогут.

#2 Обновлено Елена Евсевлеева около 1 года назад

Прошу дать обратную связь по плановому сроку внедрения. Предпочтительно реализовать до середины декабря, т.к. планирую использовать RFMCD в стратегии 2025 и презентовать на совещании по итогам года.

#3 Обновлено Наталья Фролова около 1 года назад

  • Параметр Назначена изменился с Наталья Фролова на Иван Щесюк

Ваня, прошу присвоить приоритет задаче

#4 Обновлено Иван Щесюк около 1 года назад

  • Параметр Назначена изменился с Иван Щесюк на Юлия Идимешева

#5 Обновлено Юлия Идимешева около 1 года назад

  • Параметр Дата завершения изменился с 10.09.2024 на 30.11.2024

#6 Обновлено Юлия Идимешева около 1 года назад

  • Параметр Назначена изменился с Юлия Идимешева на Елена Евсевлеева

Сегментатор доработан, передаю на тестирование.
Директория E:\Сегментаторы\Сегментатор МЦ, файл Segment_МЦ_RFMCD

#7 Обновлено Елена Евсевлеева около 1 года назад

  • Параметр Назначена изменился с Елена Евсевлеева на Юлия Идимешева

Не нашла всех разрезов. Где в сегментаторе увидеть:
Consistency (регулярность) - среднее кол-во дней между покупками
Diversity (ширина корзины) - кол-во приобретенных категорий товара
Сейчас отображено только: Ид клиента,сумма чеков, выручка, кол-во чеков. И чем сумма чеков отличается от выручка по клиенту?

#8 Обновлено Елена Евсевлеева около 1 года назад

Вижу новые разрезы.
При проверке с Кубом и Кампейном данные не бьются.
Клиент 10000124 сделал 3 чека. В сегментаторе 11 чеков.
Поле в сегментаторе "сумма чеков 360 дней" - цифры выглядят оч.завышенными. По данному клиенту указано в сегментаторе 96,2 тыс.руб. По факту 8,5 тыс.руб.
См. скрин.
Не понятны названия полей "Сумма чеков за 360 дней" и "Выручка 360 дней" - по смыслу это одно и то же, но цифры между собой сильно отличаются.

#9 Обновлено Елена Евсевлеева 12 месяца назад

Проверка сегментатора 09.01.25:
1. Клиент 10000211 - Не совпадает дней между покупками. Даты покупок за 360 дней: 23.02.2024 и 13.05.2024. Дней между покупками факт 80. В сегментаторе 129. Если взять дату ранее 360 дней (23.11.2023), то интервал также не совпадает(среднее между 90 и 80 дней).
2. Уберите все ИД клиентов, где 0 чеков. Сейчас очень много записей с 0 продажами, 0 чеками, без регулярности, но с наличием купленных категорий.
3. Клиент 10002199 в кубе 9 чеков за 360 дней. В сегментаторе 5 чеков.

#10 Обновлено Юлия Идимешева 11 месяца назад

  • Параметр Дата завершения изменился с 30.11.2024 на 28.02.2025

#11 Обновлено Юлия Идимешева 10 месяца назад

  • Параметр Дата завершения изменился с 28.02.2025 на 18.04.2025

#12 Обновлено Юлия Идимешева 9 месяца назад

  • Параметр Назначена изменился с Юлия Идимешева на Елена Евсевлеева

Добрый день. Передаю сегментатор на тестирование. Выполнены следующие доработки:
1. Скорректирован расчет дней между покупками.
2. Исключены из визуализации клиенты, не имеющие чеков.
3. Данные обновлены. Автоматическое обновление модели пока не настроено, поэтому некоторые расхождения с кубом связаны с неполнотой данных.

#13 Обновлено Елена Резинкина 8 месяца назад

  • Параметр Назначена изменился с Елена Евсевлеева на Юлия Идимешева

Данные в сегментаторе подгружены по 20.03.25
В кубе брала данные за 360 дней - это период с 25.03.24 по 20.03.25.

1. Клиент 10000246, 10001647, 10009554 - в сегментаторе и в кубе данные по сумме выручки (факт), кол-во чеков за 360 дней, дней между покупками - совпадает
2. Клиент 10001551 - в сегментаторе выручка 10664, кол-во чеков 27, в кубе выручка 11225, кол-во чеков 30.
3. Клиент 10003316 - в сегментаторе выручка 16835, в кубе выручка 16747, кол-во чеков в кубе и сегментаторе совпадает .
4. Клиент 10009598 - в сегментаторе выручка 64091, кол-во чеков 92, в кубе выручка 63801, кол-во чеков 93.
5. Клиент 10000239 - в сегментаторе выручка 36160, кол-во чеков 65, в кубе выручка 36620, кол-во чеков 68.

#14 Обновлено Елена Резинкина 7 месяца назад

Привет! Напоминаю про эту задачу. Обозначьте ориентировочные сроки решения, пожалуйста.

#15 Обновлено Юлия Идимешева 7 месяца назад

Привет! Предположительно расхождения были связаны с необновленными данными в модели. Модель обновили на выходных, до конца недели планирую пройтись по замечаниям выше и, если все сойдется, то передам модель далее на тестирование. Если расхождения останутся, то постараюсь исправить их до конца июня.

#16 Обновлено Юлия Идимешева 7 месяца назад

  • Параметр Назначена изменился с Юлия Идимешева на Елена Резинкина

#17 Обновлено Юлия Идимешева 7 месяца назад

  • Параметр Дата завершения изменился с 18.04.2025 на 27.06.2025

Привет.

Провела сверку за период 02.06.2024 - 25.05.2025.
Выявила, что расхождения были связаны с пробелом в данных за март. Данные за март перезагрузила, модель обновила.
На данный момент по перечисленным клиентам кол-во чеков сходится, выручка имеет незначительные расхождения.
Файл со сверкой оставила в директории E:\Сегментаторы\Сегментатор МЦ.

Модель можно тестировать повторно. При необходимости поставим ее на автоматическое обновление по расписанию.

#18 Обновлено Елена Резинкина 4 месяца назад

  • Файл Сверка 01.09.25.png добавлен
  • Параметр Назначена изменился с Елена Резинкина на Юлия Идимешева
22799

Сегментатор обновили. Сделала сверку, точность уже лучше, но не идеал. Взяла подряд несколько клиентов, по чекам почти сходится, по выручке у некоторых клиентов есть значительные расхождения. Скрин прилагаю
Файл "Сверка куб-сегментатор rfmcd" (вкладка "Сверка 01.09.25") в E:\Сегментаторы\Сегментатор МЦ

#19 Обновлено Юлия Идимешева около 1 месяца назад

  • Параметр Дата завершения изменился с 27.06.2025 на 28.11.2025
  • Параметр Назначена изменился с Юлия Идимешева на Елена Резинкина

Последнюю сверку проводили 03.10.2025.
Было установлено, что при сверке с кубом нужно в кубе выбирать не Выручку факт, руб., а Выручку со скидкой, руб. тогда расхождений по приведенным примерам нет или они минимальные.
Расхождения, которые оставались, были связаны с тем, что разработчики МЦ в какой-то момент перезагружали свою базу данных и некоторые покупки клиентов в определенные дни изменились. В кубе эти изменения отобразились, а в сегментаторе нет, данные в него только догружаются, но не обновляются целиком. Поэтому появились расхождения.
Насколько помню, разработчики МЦ должны были пересмотреть свою базу на корректность и пропуски данных. Обратной связи не поступало.

Экспортировать в Atom PDF