NLP
半监督 CRF
2017-10-09leihao 阅读 (1914) 评论(1)
论文点击此处 分词的任务中, 得到标注的语料是非常昂贵的; 在互联网的上, 有很多方式可以获得一个句子中部分, 例如 wiki 中的书名号和超链接. 中文分词可以看做一个序列标注的任务. 原理 图片来源: 此处 原理其实很简单, 就是修改一下目标函数, 对不知...
Scalable Topical Phrase Mining from Text Corpora 原理介绍
2017-08-29leihao 阅读 (2170) 评论(0)
原文地址: 请戳我 传统的主题模型中, 都是在词的粒度进行建模, 一个词会有多个主题 (例如 LDA) 其实在给定的语境之下, 一个词的主题基本是确定的对于一个 phrase, 可以认为其内部的 word 的主题是相同的和传统的 LDA 相比, 就是对哪些词属于...
Phrase Clustering for Discriminative Learning 原理介绍
2017-08-28leihao 阅读 (1520) 评论(0)
很有启发性的论文, 论文的内容和现在很多方法的思想惊人的相似, 文章发表时间是 2009 年, 四年之后 word2vec 模型被提出本文提出通过上下文信息对 phrase 进行聚类后作为有监督的任务的特征, 很好的提升了模型的性能论文链接戳我 Phra...
Grammar as a Foreign Language
2017-04-02leihao 阅读 (1320) 评论(0)
原始论文: Grammar as a Foreign Language 如论文的标题, 论文特别的地方是将句法分析这件事变为一个翻译问题 不了解 RNN 和 LSTM 的可以先看 RNN(Recurrent Neural Networks)...
LSTM+CRF 介绍
2017-01-16liming 阅读 (10888) 评论(0)
LSTM 和 CRF 要解决问题的: 序列标注问题(中文分词词性识别命名实体识别机器翻译等) 本文先介绍 LSTM 的基本结构, 再介绍 LSTM 与 CRF 结合的方法(CRF 的具体算法介绍不包括在本文中) LSTM 是 RNN 的一种特殊形式, 首先看一下 R...
从 LSTM 到 Seq2Seq
2017-01-13chendajun 阅读 (11905) 评论(0)
LSTM(Long Short Term Memory) 由于传统的 RNN 在进行几次链式法则求导后梯度会指数级缩小(如图), 导致传播几层后出现梯度消失, 无法处理长期依赖问题国外学者刻意设计了一种 RNN 的变体来克服这个问题, 即 LSTM...
GPU 与 Tensorflow 环境配置
2016-09-27zhanglei 阅读 (4199) 评论(5)
一 GPU 环境配置 1 硬件环境 Nvidia GTX 1070 Gigabyte Z170-HD3-CF Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz 2 软件环境 Linu...
RNN(Recurrent Neural Networks)公式推导和实现
2016-04-25leihao 阅读 (11990) 评论(7)
本文主要参考 wildml 的博客所写, 所有的代码都是 python 实现没有使用任何深度学习的工具, 公式推导虽然枯燥, 但是推导一遍之后对 RNN 的理解会更加的深入看本文之前建议对传统的神经网络的基本知识已经了解, 如果不了解的可以看此文: 神经网...
deep learning 中文分词介绍
2016-04-19leihao 阅读 (1674) 评论(2)
介绍论文 Deep Learning for Chinese Word Segmentation and POS tagging 中的方法 网络结构 网络中将中心词左右窗口向量作为输入, 词向量第一次随机初始化, 每次迭代通过反向传播更新 ...
使用 JS 生成依存句法树
2016-03-13leihao 阅读 (2930) 评论(3)
想要做公开或者公司内部使用的 nlp 平台的时候, 都要面对可视化的问题, 生成依存树可以说是很多 nlp 同学比较头疼的事情 如果公司内部找不到合适的前端工程师支持, 就只能像我一样自己搞, 所以做算法的工作很容易最后变成全栈工程师花了两天时间终于写...
12 下一页共 2 页
来源: http://x-algo.cn/index.php/category/nlp/