词嵌入和词向量
第二课的作业讲的是词嵌入和词向量,每个词都是用同样的一套特征来表示。假设我们词汇集合共有词汇10000个,每个词汇拥有300个特征。则词嵌入可以看作是一个大的矩阵(300*10000),包含了所有词汇集的编码,词向量可以看作一个词会的 one-hot 编码(10000*1),和词嵌入相乘可以得到该词汇的编码。如下图: 第二课的作业讲的是词嵌入和词向量,每个词都是用同样的一套特征来表
第二课的作业讲的是词嵌入和词向量,每个词都是用同样的一套特征来表示。假设我们词汇集合共有词汇10000个,每个词汇拥有300个特征。则词嵌入可以看作是一个大的矩阵(300*10000),包含了所有词汇集的编码,词向量可以看作一个词会的 one-hot 编码(10000*1),和词嵌入相乘可以得到该词汇的编码。如下图: 第二课的作业讲的是词嵌入和词向量,每个词都是用同样的一套特征来表