NLP笔记2:深度学习与自然语言处理

本分给我自由
1 人赞同了该文章


对离散的语言符号进行处理,就要把它映射为低维的连续向量,比如词向量,这样就可以变为可以运算的数学对象。


词向量之间的距离就可以等价于单词之间的距离,这样就可以从一个词泛化到另外一个词。


有两种神经网络可以用来处理词向量表示的语言符号。


类别

前馈网络,也叫多层感知器 MLP,非常适合用于高精准度的分类。

卷积网络是前馈网络的一种,它擅于抽取长句或者长文本中的特定短语和惯用语。


循环神经网络适合处理序列化数据,在机器翻译中大发神威,打破了强调依存关系的马尔科夫假设,会考虑词序,克服数据稀疏的问题;


用途

具有池化层和卷积的网络,更是擅长短文本分类、文本分类、CCG标注、对话状态跟踪、情感分类、问答、文本趣味性建模、实体关系分类等


循环模型可以做机器翻译、序列标注、句法分析、噪声处理、对话状态跟踪、反馈生成、语篇关系分析、语义关系分类、句法分析树等




发布于 2020-05-20 17:29:24
还没有评论
    旗渡客服