基于语义的专家推荐系统的Annoy+RMI版本,索引可以加载在另一台服务器解决内存问题。使用HNSW近似最近邻搜索推荐出最匹配的论文、专利、项目。同时使用以上数据按正态分布评分推荐出最匹配的专家。
词向量训练和HNSW索引构建
python job.py
运行推荐服务器
python server.py
- word2vec词向量并构建论文等文档向量
- Annoy索引构建
- 准备特征文件实现推荐时筛选
- 将目标查询短句分词并生成其句向量
- 使用近似最近邻算法Annoy查询出最接近目标向量的论文、专利、项目
- 使用以上数据按正态分布评分推荐出最匹配的专家