Stars
python pandas pyecharts streamlit echarts
AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库
Make Spark to compact small files like Hive
学习记录的一些笔记,以及所看得一些电子书eBooks、视频资源和平常收纳的一些自己认为比较好的博客、网站、工具。涉及大数据几大组件、Python机器学习和数据分析、Linux、操作系统、算法、网络等
程序员在家做饭方法指南。Programmer's guide about how to cook at home (Simplified Chinese only).
Data Pipeline Framework using the singer.io spec
The leading data integration platform for ETL / ELT data pipelines from APIs, databases & files to data warehouses, data lakes & data lakehouses. Both self-hosted and Cloud-hosted.
《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423
Tutorial of geospatial data processing using python 用python分析时空数据的教程(in Chinese and English )
云计算大作业,学习大数据相关组件使用,学习Spark基本组件的使用,包括Spark Streaming流数据计算,Spark GraphX图数据计算,Spark MLlib机器学习(ALS推荐,朴素贝叶斯情感分析,KMeans聚类分析)
大数据相关框架实战项目(Hadoop, Spark, Storm, Flink)
Notes talking about the design and implementation of Apache Spark
🔥🔥 AllData可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为工厂,以大模型应用为上游产品,提供全链路数字化解决方案。采购商业版、加入技术社区:https://docs.qq.com/doc/DVHlkSEtvVXVCdEFo
Repo for counting stars and contributing. Press F to pay respect to glorious developers.
🎯 🌟[大数据面试题]分享自己在网络上收集的大数据相关的面试题以及自己的答案总结.目前包含Hadoop/Hive/Spark/Flink/Hbase/Kafka/Zookeeper框架的面试题知识总结
log、event 、time 、window 、table、sql、connect、join、async IO、维表、CEP
The hassle-free way to integrate analytics into any java application.
《python数据分析与挖掘实战》的代码笔记