Stars
此项目是对大学生的一卡通消费数据、图书借阅记录和图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用sparkSQL集合hive进行大数据分析
winutils.exe hadoop.dll and hdfs.dll binaries for hadoop windows
学习spark写的scala代码,工具使用的是IDEA2017.1.6,欢迎star
zchaizju / 2018-IJCAI-top3
Forked from luoda888/2018-IJCAI-top3This 2018 IJCAI alimama Top3 Code
zchaizju / keras
Forked from keras-team/kerasDeep Learning library for Python. Runs on TensorFlow, Theano, or CNTK.
宽度学习 Broad Learning System MATLAB 代码 / 寬度學習Broad Learning System MATLAB代碼(1):MNIST實踐
predicting student academic performance
hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规模订单即席查询,和多维度查询) 第四阶段(数据挖掘和图计算)