宁静致远

  • 首页

  • 归档

  • 标签

  • 分类

基于BiLstm+CRF的命名实体识别(NER)Keras实现

发表于 2019-08-21 | 分类于 nlp , ml
本文字数: 4.8k | 阅读时长 ≈ 4 分钟

概述在NLP的序列标注任务里面,NER是基础的上游任务,也就意味着,业界许多垂直领域的NLP项目,NER是绕不开的任务。今天的这篇博客,笔者不想涉及深入的算法和数学知识,仅就在代码实现层面,对有监督的NER训练,做一些介绍。对于NER一知半解的读者,可以移步笔者的另一篇博文——《命名实体识别概述》。 ...

阅读全文 »

《梁启超家书》文摘

发表于 2019-08-11 | 更新于 2019-08-21 | 分类于 读书
本文字数: 4k | 阅读时长 ≈ 4 分钟

前言 人生于天地之间,各有责任。知责任者,大丈夫之始也;行责任者,大丈夫之终也;自放弃其责任,则是自放弃其所以为人之具也。 梁启超说:“你如果做成一个人,智识自然是越多越好。你如果做不成一个人,智识却是越多越坏。” 梁启超号召学生:“养足你的根本智慧,体验出你的人格人生观,保护好你的自由意志 ...

阅读全文 »

NLTK简述

发表于 2019-08-01 | 更新于 2019-08-05 | 分类于 ml , nlp
本文字数: 4.5k | 阅读时长 ≈ 4 分钟

1. 概述NLTK不支持中文分词,对于英文,提供了基本的文本处理工具,丰富的语料和预训练模型。 2. 常用文本处理2.1 词语、句子的Token化from nltk.tokenize import word_tokenizetext = "God is Great! I won a lottery. ...

阅读全文 »

序列标注任务

发表于 2019-07-31 | 更新于 2019-08-05
本文字数: 217 | 阅读时长 ≈ 1 分钟

1. 概述序列标注任务是中文自然语言处理(NLP)领域在句子层面中的主要任务,输入是一个序列,他的输出也是一个序列。 2. 子任务 分词 词性标注 命名实体识别 关系抽取 … 3. 涉及算法3.1 传统机器学习HMM(隐马尔科夫模型)CRF(条件随机场)3.2 深度学习Bi-LSTM CRF4. ...

阅读全文 »

命名实体识别(NER)

发表于 2019-07-31 | 更新于 2019-08-05 | 分类于 ml , nlp
本文字数: 1.1k | 阅读时长 ≈ 1 分钟

1. 概念命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。简单的讲,就是识别自然文本中的实体指称的边界和类别。 2. 实现 有监督的学习方法:这一类方法需要利用大规模的已标注 ...

阅读全文 »

实体关系抽取

发表于 2019-07-31 | 更新于 2019-08-05 | 分类于 ml , nlp
本文字数: 1.8k | 阅读时长 ≈ 2 分钟

1. 概述信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。关系抽取是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系。 2. 关系抽取方法2.1 基于规则匹配比如,对于IS-A这样的关系,我们可以使用如下的规则进行抽取: “Y such as X ((, X ...

阅读全文 »
大雁

大雁

机器学习、深度学习、Python、自然语言处理、计算机视觉
6 日志
5 分类
10 标签
© 2019 大雁 | 站点总字数: 16k | 站点阅读时长 ≈ 15 分钟
由 Hexo 强力驱动 v3.9.0
|
主题 – NexT.Gemini v7.1.2