Pandas 2.0发布了,是时候把之前写的 Python 数据分析的教程重新整理一下了,顺便也探索一下 pandas 2.0 的新东西,跟 Polars 做一下比较。准备花两周时间把这套教程更新完,在花点时间对比下 Polars 以及其他工具。喜欢这套课程的小伙伴可以 Star 鼓励一下,非常感谢!Github 最近在国内访问确实让人难受,国内的小伙伴如果觉得这套课程还不错,可以看我在知乎专栏上的分享(传送门),相关视频在B站上可以找到(传送门)。
01 - 数据分析概述
- 数据分析师的职责
- 数据分析师的技能栈
- 数据分析相关库
02 - 环境准备
- 安装和使用anaconda
- conda相关命令
- 安装和使用jupyter-lab
- 安装和启动
- 使用小技巧
03 - NumPy的应用-1
- 创建数组对象
- 数组对象的属性
- 数组对象的索引运算
- 普通索引
- 花式索引
- 布尔索引
- 切片索引
- 案例:使用数组处理图像
04 - NumPy的应用-2
- 数组对象的相关方法
- 获取描述性统计信息
- 其他相关方法
05 - NumPy的应用-3
- 数组的运算
- 数组跟标量的运算
- 数组跟数组的运算
- 通用一元函数
- 通用二元函数
- 广播机制
- Numpy常用函数
06 - NumPy的应用-4
- 向量
- 行列式
- 矩阵
- 多项式
07 - 深入浅出pandas-1
- 创建Series对象
- Series对象的运算
- Series对象的属性和方法
08 - 深入浅出pandas-2
- 创建DataFrame对象
- DataFrame对象的属性和方法
- 读写DataFrame中的数据
09 - 深入浅出pandas-3
- 数据重塑
- 数据拼接
- 数据合并
- 数据清洗
- 缺失值
- 重复值
- 异常值
- 预处理
10 - 深入浅出pandas-4
- 数据透视
- 获取描述性统计信息
- 排序和头部值
- 分组聚合
- 透视表和交叉表
- 数据呈现
11 - 深入浅出pandas-5
- 计算同比环比
- 窗口计算
- 相关性判定
12 - 深入浅出pandas-6
- 索引的使用
- 范围索引
- 分类索引
- 多级索引
- 间隔索引
- 日期时间索引
13 - 数据可视化-1
- 安装和导入matplotlib
- 创建画布
- 创建坐标系
- 绘制图表
- 折线图
- 散点图
- 柱状图
- 饼状图
- 直方图
- 箱线图
- 显示和保存图表
14 - 数据可视化-2
- 气泡图
- 面积图
- 雷达图
- 玫瑰图
- 3D图表
15 - 数据可视化-3
- Seaborn
- Pyecharts