Skip to content

Commit 62fe9c5

Browse files
authored
Update word-embedding-dataset.md
1 parent 42e6412 commit 62fe9c5

File tree

1 file changed

+1
-1
lines changed

1 file changed

+1
-1
lines changed

chapter_natural-language-processing-pretraining/word-embedding-dataset.md

+1-1
Original file line numberDiff line numberDiff line change
@@ -20,7 +20,7 @@ import os
2020
import random
2121
```
2222

23-
## 正在读取数据集
23+
## 读取数据集
2424

2525
我们在这里使用的数据集是[Penn Tree Bank(PTB)](https://catalog.ldc.upenn.edu/LDC99T42)。该语料库取自“华尔街日报”的文章,分为训练集、验证集和测试集。在原始格式中,文本文件的每一行表示由空格分隔的一句话。在这里,我们将每个单词视为一个词元。
2626

0 commit comments

Comments
 (0)