SOHU2022 情感分析 × 推荐排序算法大赛 RANK 5

基于树模型的解决方案，从以下三方面来处理特征

rank特征

label的分布和pvid内的顺序相关

一行代码分析分布平衡：plot_cat_by(train,test,cols='rank',label='label')

主要是通过构造相关的特征上分，包括：

当日曝光，历史曝光，全局曝光等

word2vec 对历史序列进行word2vec，对embedding做统计max,min,sum,mean,std
target attention 当前item的embedding对历史序列item的embedding做corr，然后对corr做统计max,min,sum,mean,std

catboost利用五折做融合，单模cv708 lb705

pip install lianyhaii
## 下载数据放到Sohu2022_data
python train.py