分布式电影推荐系统

北京大学2019年秋《云计算与大数据平台》课程项目。

这是一个结合了 Hadoop、Hbase、Spark、MongoDB、Django 等开源框架的高可用分布式电影推荐系统，并以 Web 页面为用户提供了友好的访问方式。

系统功能

基本功能
- 登录注册
- 个人信息维护
- 按类别电影展示
- 电影搜索
- 电影详情查看
- 电影评分
- 电影评论
后台管理
电影推荐
- 协同过滤推荐
- 兴趣推荐
- 在线推荐

系统架构

我们的数据基于 MovieLens 20M，将该数据集的 rating.csv 文件存入 HDFS 集群，并从 IMDB 爬取数据集中的电影基本信息与电影图片，电影基本信息经过处理后存入 MongoDB 集群，电影图片存入 Hbaes 集群。计算模块运行于 YARN 集群上，其中 Spark 负责离线推荐计算，Spark Streaming 负责在线推荐计算，离线推荐计算的任务每天执行一次，在线推荐计算的任务来源于 Kafka 消息队列，时间窗口和间隔均为一分钟，计算所得的推荐结果存入 MongoDB 集群。使用 Nginx 处理负载均衡和静态文件(电影图片、css、js)，使用 uWSGI 启动 Django 服务，并将动静请求分离，Redis 作为 Django 的缓存。Zookeeper 用来保证 Kafka、YARN、HDFS 和 Hbase 的高可用性。

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
algorithm		algorithm
data_to_mongo		data_to_mongo
moviesite		moviesite
spider		spider
README.md		README.md
简单使用.md		简单使用.md
详细使用.md		详细使用.md
详细配置.md		详细配置.md
项目报告.pdf		项目报告.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

分布式电影推荐系统

系统功能

系统架构

体系框架

配置与使用

About

Releases

Packages

Languages

zhurboo/moviesite

Folders and files

Latest commit

History

Repository files navigation

分布式电影推荐系统

系统功能

系统架构

体系框架

配置与使用

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages