信息抽取及其实现
本文分别介绍抽取新词、关键词、关键短语和自动摘要的无监督学习方法。
本文分别介绍抽取新词、关键词、关键短语和自动摘要的无监督学习方法。
命名实体:文本中有一些描述实体的词汇。比如人名、地名、组织机构名、股票基金、医学术语等
词性标注指的是为句子中每个单词预测一个词性标签的任务。
本文介绍的是基于字符串匹配的中文分词的方法。
本文介绍的是基于统计的中文分词的方法。
朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,给定一个类别y和一个从到的相关的特征向量, 贝叶斯定理公式表示如下: