我们提供了常见的排序任务中使用的模型算法的PaddleRec实现, 包括动态图和静态图的单机训练&预测效果指标。实现的排序模型包括 logistic regression、多层神经网络、FM、gatenet、DeepFM、Wide&Deep、naml。
模型算法库在持续添加中,欢迎关注。
下面是每个模型的简介(注:图片引用自链接中的论文)
# 进入模型目录
cd models/rank/xxx # xxx为任意的rank下的模型目录
# 动态图训练
python -u ../../../tools/trainer.py -m config.yaml # 全量数据运行config_bigdata.yaml
# 动态图预测
python -u ../../../tools/infer.py -m config.yaml
# 静态图训练
python -u ../../../tools/static_trainer.py -m config.yaml # 全量数据运行config_bigdata.yaml
# 静态图预测
python -u ../../../tools/static_infer.py -m config.yaml
数据集 | 模型 | loss | auc | acc |
---|---|---|---|---|
Criteo | DNN | -- | 0.77 | -- |
Criteo | Logistic Regression | -- | 0.67 | -- |
Criteo | FM | -- | 0.78 | -- |
Criteo | GateDnn | -- | 0.79 | -- |
MIND | naml | -- | -- | top1:0.43 |
Criteo | DeepFM | 0.44797 | 0.78 | -- |
criteo | Wide&Deep | 0.76195 | 0.82 | -- |
amazon | BST | -- | 0.77 | -- |
criteo | dcn | -- | 0.77 | -- |
criteo | deepfefm | -- | 0.8028 | -- |
amazonElec_Din | dien | -- | 0.826 | -- |
amazonElec_Din | din | -- | 0.83 | -- |
criteo | DLRM | -- | 0.79 | -- |
Ali_Display_Ad_Click | dmr | -- | 0.6434 | -- |
criteo | ffm | -- | 0.79 | -- |
criteo | xDeepFM | -- | 0.79 | -- |
您需要进入PaddleRec/datasets目录下的对应数据集中运行脚本获取全量数据集,然后在模型目录下使用全量数据的参数运行。
每个模型下的readme中都有详细的效果复现的教程,您可以进入模型的目录中详细查看。