1. 课程练习是否有答案?
见本页面对应的L1/L2/L3三个文件夹。需要注意的是,绝大部分答案是助教自己做的,虽然基本可以保证答案正确,但不一定是最优的实现方法。如果你有更好的代码建议或实现方案,欢迎在社群内分享。
查看答案后如果仍希望知道自己代码报错的原因或答案代码的逻辑,处理原则同P2:
在经过以上步骤,仍然不知道代码(包括做项目时和项目有关的代码)的出错原因或者某段答案代码的逻辑,请在通关群提供以下信息并@助教,并描述问题。
- 练习对应的课程章节;
- 练习界面的截图(如果代码报错,请务必将报错信息全部截图);
- 文本格式的代码(从练习界面复制,粘贴到聊天框发送)。
- 注意:如果希望解决自己写的代码中的疑问,在提供以上信息的同时,最好能说明自己解决问题思路和疑惑的地方,以便助教更好定位你的知识盲点并提供相应建议。仅仅问一句“为什么我的代码不对”并不是推荐的提问方式,因为重要的不是正确与否,而是实现思路。直接指出错误并告诉正确答案当然很容易,但对于学员而言,以后实际工作中如果遇到类似问题,没有正确的思路还是无法解决,这点敬请理解。
2. 如何将上一节练习生成的数据导入到下一节的Workspace中?
请参考本页面的.mp4视频文件“Workspace中导入上一节生成的数据.mp4”。
3. 课程1-15节“评估和理解”练习中,“有多少教育的唯一值”是什么意思?
意思是“教育的可能取值的数量”。例如,假设数据集中教育一共有5类:小学、初中、高中、大学、其他。则“教育的唯一值”为5。
4. 为什么做在线练习时,加载数据会报错,提示数据不存在(not exist错误)?
请注意,P3课程的大部分练习,数据都需要自行导入。具体操作方法为,找到上一节练习,下载对应数据,导入到这一节的工作环境。如果上一节练习没有对应数据,请往回多翻几个练习,总能够找到相关数据,不存在数据缺失的问题(助教亲测)。至于如何下载、导入数据,见本节问题2。
5. 关于“偏度”“左偏”“右偏”(Skewed)的解释:
来自维基百科:
6. 做项目时选择电影数据集,如何将其中的Genres/Director/Production Company等包含“|”的字段进行分割处理?
请参考此链接中的解决方案(感谢学员Mindlake提供的链接)
- Pandas部分内置方法中的inplace参数:http://blog.sciencenet.cn/blog-645086-884388.html
- Lambda表达式:https://www.cnblogs.com/evening/archive/2012/03/29/2423554.html
- 直方图参数说明:http://www.cnblogs.com/python-life/articles/6084059.html
- Pandas内置方法rename中的“index=str”解释:https://stackoverflow.com/questions/42080360/what-is-the-parameter-index-in-pandas-dataframe-rename-method
- Matplotlib图例中文乱码的解决方法:https://www.zhihu.com/question/25404709
- Python中的浅拷贝和深拷贝:https://www.jianshu.com/p/efa9dd51f5cc
- 使用subplot同时画多张图表:https://matplotlib.org/gallery/subplots_axes_and_figures/subplot.html
- 一张图中画多组直方图:https://matplotlib.org/examples/statistics/histogram_demo_multihist.html
- Notebook中出现SettingWithCopyWarning警告的解释:https://stackoverflow.com/questions/20625582/how-to-deal-with-settingwithcopywarning-in-pandas
**1. conda/pip更新很慢/包下载很慢/下载中断/出现Time Out错误或类似提示等;
由于不可抗力因素,中国大陆用户下载第三方库时可能会出现此情况。推荐使用清华大学提供的镜像源,具体操作方式见此链接。另外,也可以无需pip命令设置镜像源,具体可见此链接。
2. 如何同时安装Python3和Python2?
Conda支持安装多个Python环境,具体操作方式见此链接
3. 为什么装了多个环境,Jupyter Notebook还是只能使用一个版本的Python?
请检查你是否在所有环境中安装了Jupyter Notebook,具体方式如下:
4. 命令行是什么?如何在命令行转换目录?
由于命令行不是本课程的教学内容,所有命令行相关的疑问均请参见此链接
6. 在命令行和Anaconda Prompt中都无法使用Conda命令的所有解决方案。
- 检查系统版本。Anaconda已经不支持Windows XP;同时查看自己电脑是32位还是64位(本页面视频有说明),不要装错了;
- 检查自己是否原来安装过Python,如果安装过请彻底删除Python(同时要删除环境变量)后重装Anaconda;
- 检查自己是否将Conda命令添加到了环境变量,操作方法见本页面;
- 确保你的Anaconda安装路径不包含中文或其他非英语常用字符;
- 经过以上步骤还是没有任何改善,请卸载Anaconda重装一遍;
- 重装一遍后还是没有改善,说明助教也不知道原因,无法帮助你,所以不用在群里@助教了,直接使用微软出品的Azure Notebook作为替代方案完成课程和项目。
7. Mac系统下无法安装matplotlib,提示“Failed building wheel for subprocess32”
安装Xcode
8. 安装Anaconda时显示UnicodeDecodeError。
- 如果Python是2.7版本的,请确保安装路径没有中文或者其他非英语常用字符;
- 如果安装路径不存在上述问题,请参考此链接解决。
9. 如何正确下载Notebook?
- 右键另存为,将文件存入任一文件夹;
- 更改文件夹后缀名为.ipynb。如果无法修改,请在文件管理器中勾选下图的“文件扩展名”,再对文件重命名,直接修改后缀。最终你的文件名为“xxxx.ipynb”
10. 两个简明的Anaconda和Jupyter Notebook使用教程(感谢学员悟空和知乎用户“猴子”提供的链接及教程内容)
11. 在Jupyter Notebook中按Tab键无法自动补全代码。
请尝试安装pyreadline包,命令如下:
conda install pyreadline
再打开Notebook重试补全代码功能。
12. 明明已经使用命令安装了某个包(比如Unicodecsv),在Notebook导入时却显示No module named XXX错误。
目前还没有根本性的解决办法,可能是环境变量的问题导致。一个可行的方案是创建新环境,并与Notebook关联,所有代码都在新环境中运行。具体步骤如下:
假如你第一次安装Anaconda,系统会自动创建一个默认环境,Notebook中也只有默认环境。默认环境中包无法导入时,请尝试如下命令(假设你的Python版本为2.7):
conda create -n py27 python=2.7 anaconda #创建环境,py27可以是其他名称
conda install nb_conda
acitvate py27 #进入新环境
conda install unicodecsv #在新环境中安装模块
然后再启动jupyter notebook,做如下操作:
点击Python [conda env: py27],切换到py27环境,再运行代码看下能否导入模块。
请注意,以后进入所有notebook的时候,都需要切换到py27环境。你安装所有包时,都需要先使用activate py27命令,在新环境中安装。
13. 在Mac环境下运行Jupyter Notebook报如下错误:
解决办法:使用此命令启动Jupyter Notebook:
jupyter notebook --NotebookApp.iopub_data_rate_limit=10000000000
14. 运行Conda命令时出现“Missing write permissions”错误:
请使用如下方式打开Anaconda Prompt,再次运行Conda命令: