Skip to content

Commit

Permalink
textcnn
Browse files Browse the repository at this point in the history
  • Loading branch information
astonzhang committed Jul 30, 2018
1 parent 7bb0b44 commit bfdb8b3
Showing 1 changed file with 1 addition and 1 deletion.
Original file line number Diff line number Diff line change
Expand Up @@ -9,7 +9,7 @@ TODO(@astonzhang): edits

卷积神经网络在自然语言处理上,可以类比到图像任务上,即把一个文本用二维图像的方式来表达。每个文本是一个矩阵,将文本中每个词的词向量按顺序纵向排列,即这个矩阵的每一行分别是一个词向量。

在卷积层中,使用不同的卷积核获取不同窗口大小内词的关系;而与计算机视觉中的二维卷积不同的是,自然语言处理任务中一般用的是一维卷积,即卷积核的宽度是词嵌入的维度。因为我们需要获取的是不同窗口内的词所带来的信息。然后,我们应用一个最大池化层,这里采用的是`Max-over-time pooling`,即对一个feature map选取一个最大值保留,这个最大值可以理解为是这个feature map最重要的特征。将这些取到的最大值连结成一个向量。而由于只取最大值,在做padding时补0,并不会影响结果。
在卷积层中,使用不同的卷积核获取不同窗口大小内词的关系;而与计算机视觉中的二维卷积不同的是,自然语言处理任务中一般用的是一维卷积,即卷积核的宽度是词嵌入的维度。因为我们需要获取的是不同窗口内的词所带来的信息。然后,我们应用一个最大池化层,这里采用的是Max-over-time pooling,即对一个feature map选取一个最大值保留,这个最大值可以理解为是这个feature map最重要的特征。将这些取到的最大值连结成一个向量。而由于只取最大值,在做padding时补0,并不会影响结果。

最后,我们将连结得到的向量通过全连接层变换为输出。我们在全连接层前加一个Dropout层,用于减轻过拟合。

Expand Down

0 comments on commit bfdb8b3

Please sign in to comment.