Аналитика
Сверка и аудит
Как сверять данные, проверять расчёты и контролировать корректность аналитики.
Сверка, контроль качества и аудит
1. Контур сверки
- Source-to-Raw: количество записей и контрольные суммы по источнику.
- Raw-to-Staging: проверка очистки, дублей, отбраковки.
- Staging-to-Mart: сверка агрегатов и KPI-витрин.
- Mart-to-Dashboard: контроль идентичности цифр между витриной и UI.
2. Ежедневные автоматические проверки
- Record Count Check: сравнение объёмов данных с ожидаемым диапазоном.
- Freshness Check: контроль задержки поступления данных.
- Null/Range Check: обязательные поля и допустимые диапазоны.
- Duplicate Check: дубли по бизнес-ключу.
- Referential Integrity: корректность ссылок на справочники.
- Dictionary Mismatch Check: расхождения кода/названия модели и дилерских справочников.
3. Формулы сверки
- Сверка количества:
count_delta_pct = |count_source - count_mart| / count_source
- Сверка сумм:
amount_delta_pct = |sum_source - sum_mart| / sum_source
- Сверка KPI:
kpi_delta_pct = |kpi_calc_reference - kpi_calc_mart| / kpi_calc_reference
Пороги:
count_delta_pct <= 0.1%amount_delta_pct <= 0.2%kpi_delta_pct <= 0.1%
4. Контроль формул и версий
- Для каждой метрики хранится
metric_code,formula_text,version,effective_from. - Изменение формулы возможно только через утверждённый change request.
- После изменения формулы выполняется ретро-пересчёт на контрольном интервале.
5. Процедура расследования расхождений
- Зафиксировать KPI/витрину/период и величину отклонения.
- Проверить входной слой (source/raw) на полноту и дубли.
- Проверить логи трансформаций и фильтров в staging/core.
- Пересчитать KPI вручную на сэмпле данных.
- Сравнить результат с витриной и UI.
- Выполнить автоисправление типовых ошибок и повторную сверку.
- Передать спорные случаи на ручной контроль data steward.
- Отправить дилеру обратную связь по обнаруженным проблемам.
- Зафиксировать root cause и корректирующее действие.
6. Аудит и трассировка
- Любой KPI в UI должен иметь ссылку на источник витрины.
- Для каждой цифры должен быть доступен путь: KPI -> SQL -> таблица -> источник.
- Логи изменений формул и pipeline хранятся не менее 12 месяцев.
7. Чек-лист релиза аналитики
- Все DQ-проверки зелёные на 30 дней истории.
- SLA обновления выполняется без деградации.
- KPI сверены с эталонными расчётами.
- Алерты корректно срабатывают на тестовых кейсах.
- Пользовательские роли и доступы проверены.