GoodsForecast.OSA - Определение наличия товаров на полке в интервалах без продаж (OSA - показатель представленности продукции на полке магазина).
Использовали ансамбль из CatBoostClassifier. Обучали модели на всех данных, на не коррелирующих данных, добавляли веса на сэмлы, т.к. соотношение таргета на обучающей и валидационной выборках сильно отличались. Использовали дополнительные данные, такие как: количество остаткой, агрегации - с группировкой по локации, товару или локация + товар и количество продаж и сумма продаж. Исключаем текущую дату, так как она идет после ValidationDateTime
dataset.ipynb
- ноутбук для загрузки данных, подготовки датасетов и их сохраненияBoostring Training.ipynb
- ноутбук для обучения моделей для публичного теста (чекпоинты 1 и 2), обучения моделей для финального сабмита, сохранение моделей.
Финальная метрика: roc_auc_score: 0.701
Обзор на хакатон и заряд добра получаем тут https://t.me/pleshakovsky