Part I
-
挑选三个变量作为预测变量
- Median_age_persons
- Median_tot_prsnl_inc_weekly
- Median_rent_weekly
-
检查预测变量
-
了解三个预测变量的均值,标准差,分布情况的一张图(对于整体数据而言)
-
是否需要recode,写下清理数据的决定
是 - 查看数据时发现有地区有投票但是收入等数据都是0,所以清理数据决定把这些清理掉
然后变量重新命名一下
-
-
进行描述性分析
Part II
- 按政党分类,分成五张表,套用回归模型glm
- 每个政党在每个州的预测变量分布情况,比如绿党的年龄分布情况
- 5个政党 3个因素 5张不同政党投票分布情况 一共20张图,选10张做(因为一个自变量和一个因变量,1x5个党 + 1x5个党)
- 写下发现