SQL-кейс: ответы на продуктовые вопросы по донорской платформе на основе данных о пользователях и донациях.
Формат проекта: один SQL-файл с запросами и короткими выводами по каждой задаче.
- Найти регионы с наибольшим количеством зарегистрированных доноров.
- Изучить динамику общего количества донаций по месяцам за 2022–2023 годы.
- Определить наиболее активных доноров (по подтверждённым донациям).
- Оценить связь бонусной системы и активности доноров.
- Оценить каналы привлечения через соцсети и среднюю активность по каналам.
- Сравнить активность повторных доноров и проверить качество дат в данных.
- Сопоставить планируемые донации с фактическими (plan vs fact).
- Посчитал топ регионов по числу зарегистрированных доноров и отметил проблему пропусков региона.
- Построил помесячную динамику донаций за 2022–2023 и описал сезонность.
- Выделил пул самых активных доноров по количеству подтверждённых донаций.
- Сравнил активность доноров с бонусами и без (корреляционный срез).
- Разложил доноров по каналам соц.авторизации и сравнил среднюю активность (для доноров с ≥ 1 донацией).
- Сегментировал повторных доноров по частоте и выявил аномалии длительности активности.
- Посчитал долю выполнения планов донаций по типам (план vs факт).
- Качество данных: встречаются пустые значения региона; также заметны аномальные длительности активности, что указывает на возможные проблемы с датами.
- Сезонность: в динамике донаций заметны пики весной и периоды снижения в середине/конце года.
- Бонусы: доноры с бонусами в среднем активнее; важно помнить, что это корреляция и возможен эффект отбора.
- Каналы привлечения: каналы отличаются по масштабу и средней активности; есть смысл сравнить долю повторных доноров по каналам.
- Планирование: доля выполненных планов низкая и различается по типу донации — зона для улучшения механик вовлечения и коммуникаций.
- Посчитать долю пустого
regionи предложить способ валидации/обязательности заполнения. - Сравнить 2022 vs 2023 по YoY (месяц к месяцу) и выделить месяцы с максимальными изменениями.
- Проверить вклад топ-N доноров в общий объём подтверждённых донаций.
- Для бонусов: сравнить активность одного и того же донора до/после первого бонуса (а не только “с бонусами / без”).
- По каналам: посчитать долю повторных доноров (
confirmed_donations >= 2) и сравнить её между каналами. - Очистить/отфильтровать некорректные даты и пересчитать метрики повторяемости и “длительности активности”.
- План vs факт: разложить
completion_rateпо месяцам и по сегментам доноров (новые/повторные).
sql/analysis.sql— запросы и короткие выводы по всем задачам.
SQL (JOIN, CTE, агрегаты, DATE_TRUNC)