阅读背景：

word2vec并行实现小记

发表于:2021-04-11

word2vec能将文本中出现的词向量化，其原理建立在Mikolov的博士论文成果及其在谷歌的研究经验的基础上。与潜在语义分析（Latent Semantic Index, LSI）、潜在狄立克雷分配（Latent Dirichlet Allocation）的经典过程相比，word2vec利用了词的上下文，语义信息更加地丰富。word2vec并不是Mikolov某一天拍拍脑袋就给想出来的，也是站在牛人的肩膀上。大牛Bengio(NIPS 2001)借着深度学习的东风提出了一种可并行的神经网络模型；Morin(2005)为了加快神经网络语言模型（Neural Network Language Model，NNLM）的概率输出Softmax的计算，提出了Hierarchical Softmax；Mikolov同学慢慢地注意到神经网络在语言模型中的作用，早年的论文多在语音领域，其博士论文总结并优化了循环神经网络（Recurrent Neural Network），之后到了谷歌做研究，才总算提出了word2vec。这一段历史可进一步查看word2vec能将文本中出现的词向量化，其原理建立在Mikolov的博士论文成果及其在

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。

你可能喜欢:

JS通过ActiveX读写ini配置文件

设计模式六：singleton单件模式——对象创建型模式

ckeditor在IE中引用word文件图片都不显示只显示文字连图片框都没有火狐能显示框

在Word中读取数据库内容到Word内(VBA)

python的学习之路day5

使用Thrift API监控Storm集群和Topology

『Python』源码解析_从ctype模块理解底层源码

在区域监控时检测iBeacon需要多长时间？

json net领先零（可弃基础）

SQLite.NET提供程序的选择

相关阅读:

【超强干货】图像去噪、图像去水印、图像篡改、图像修复超强干货论文+源码整理

00 爬虫概念

避雷指南：11个常见 Kubernetes 误区详解

官宣正式成为 PostgreSQL Contributor，Richard 有何秘诀？

PieCloudDB Database 多种压缩手段：降低数据库存储成本

[置顶] Cocos2d-JS中使用CocosStudio资源——关卡选择界面

DevOps迈向标准化，平台工程让开发运维更轻松

官宣正式成为 PostgreSQL Contributor，Richard 有何秘诀？

超越基础设施：深度探讨平台工程的关键支柱

【超强干货】图像去噪、图像去水印、图像篡改、图像修复超强干货论文+源码整理

随便看看:

android环境传感器

手工搭建Data Guard

Spring Cloud(Finchley.RCI) (九) Spring Cloud分布式配置中心

使用MD5加密的登陆demo

OpenTofu路在何方：定量分析Terraform issue数据，洞察用户需求｜OpenTofu Day 闪电演讲

Backtrader官方中文文档:第八章Indicators指标

javascript中的遍历for in 以及with的用法

centos5.11 6.6中关于编译安装percona server 5.5.42的疑问

通过编排管理 Docker 容器

详解box-shadow