diff --git a/chapter_multilayer-perceptrons/kaggle-house-price.md b/chapter_multilayer-perceptrons/kaggle-house-price.md index ac32f1a05..850da187b 100644 --- a/chapter_multilayer-perceptrons/kaggle-house-price.md +++ b/chapter_multilayer-perceptrons/kaggle-house-price.md @@ -3,7 +3,7 @@ 现在我们已经介绍了一些建立和训练深度网络的基本工具,和网络正则化的技术(如权重衰减、Dropout等)。我们准备通过参加Kaggle比赛来将所有这些知识付诸实践。房价预测比赛是一个很好的起点。这个数据是相当通用的,不会需要使用带特殊结构的模型(就像音频或视频可能需要的那样)。此数据集由Bart de Cock于2011年收集 :cite:`De-Cock.2011` ,涵盖了2006-2010年期间亚利桑那州埃姆斯市的房价。它比哈里森和鲁宾菲尔德(1978年)的[波士顿房价](https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.names)数据集要大得多,也有更多的特征。 -在本节中,我们将详细介绍数据预处理、模型设计和超参数选择。我们希望通过亲身实践的方式,你将获得一些直觉。这些直觉将指导你数据科学家职业生涯。 +在本节中,我们将详细介绍数据预处理、模型设计和超参数选择。我们希望通过亲身实践的方式,你将获得一些直观的感受。这些感受将指导你数据科学家职业生涯。 ## 下载和缓存数据集 @@ -22,7 +22,7 @@ DATA_HUB = dict() DATA_URL = 'http://d2l-data.s3-accelerate.amazonaws.com/' ``` -下面的`download`函数用来下载数据集,将数据集缓存在本地目录(默认情况下为`../data`)中,并返回下载文件的名称。如果缓存目录中已经存在与此数据集文件,并且其sha-1与存储在`DATA_HUB`中的相匹配,我们将使用缓存的文件,以避免重复的下载。 +下面的`download`函数用来下载数据集,将数据集缓存在本地目录(默认情况下为`../data`)中,并返回下载文件的名称。如果缓存目录中已经存在此数据集文件,并且其sha-1与存储在`DATA_HUB`中的相匹配,我们将使用缓存的文件,以避免重复的下载。 ```{.python .input} #@tab all