README

模型输入

模型输入包含以下几个模块
- 读取模型文件：该代码在conf.train=True模式下只会读取训练集，不会读取测试集。在conf.train=False模式下会读取训练集和测试集，并统一编码和归一化。
- 特征合并：如果还使用face特征以及title特征，那么会在训练集和测试集中添加特征列，这些特征列的值与item_id一一对应。
- 预处理：预处理包括两部分，对sparse feature的空值填充-1，对dense feature的空值填充0。还有对sparse feature进行统计并转化成index，对dense feature进行归一化到(0,1)之间。
- 产生sparse/dense_feature_list：列表元素为SingleFeat实例，SingleFeat为namedtuple，用于之后输入模型来构建模型(模型构建需要知道sparse feature有多少种值)。
模型输入格式
- 模型的输入为np.array的list，每一个np.array表示一种特征。
- 输入list中sparse feature的输入在前，dense feature输入在后。两者的feature输入顺序要和模型构建时传递进去的sparse feature和dense feature列表的顺序一致。

模型训练包括两步
- 构建模型：通过sparse feature和dense feature的个数，embedding维度等构建模型。
- 训练模型：baseline使用tf.keras.Model()来训练预测模型，也可以自定义模型放在model/文件夹下。
模型预测
- 在conf.train=False模式下模型训练完之后会自动地进行预测，并保存result_(TimeStamp).csv文件到result/文件夹下。

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
git		git
model		model
others		others
DataAnalysis.ipynb		DataAnalysis.ipynb
README.md		README.md
RECORD.md		RECORD.md
Reading.md		Reading.md
config.py		config.py
dataloader.py		dataloader.py
logger.py		logger.py
predict.py		predict.py
title_tfidf.py		title_tfidf.py
train.ipynb		train.ipynb
train.py		train.py
trainFM.py		trainFM.py
tranformfile.py		tranformfile.py
utils.py		utils.py