如何从短文本中提取关键词并分类?
从短文本很容易提出出关键词,但多多少少会有一些担心,单词提取不准的问题
在这里分享三种关键词提取的方法
关键词提取
短语关键词提取
我们打开微词云中的词云设计工具,很多小伙伴并不知道词云设计还有很多的用途
例如我这里用词云生成器来统计短语关键词
操作很简单,把所有的短句子全部复制粘贴到简单导入中,只开启一下配置例如“去空格”,也可以试试开启“过滤常用语”
在点击右侧底部的蓝色按钮就行了,这里统计的都是比较整块的短语关键词了
下载统计结果数据,筛选出比较中意的3~6个字的关键词,当然2个字的词也可以都选出来
接下来我们可以利用新词挖掘工具来提取下更有研究价值的关键词
新词挖掘提取关键词
我们打开微词云中的新词挖掘工具
这里强调下,所谓的新词是以系统默认的分词词典为基础的,分词词典中没有的单词为新词
中文通用分析中的词典就是调用的这个分词词典,下面会提到,这里就不多说了
紧接着,我们把短文本导入到新词挖掘工具中
我们会发现有很多新词结果数据,我们下载这些数据就行了
可以根据词频大小、新词概率、自由度等指标来筛选有价值的新词
接下来我们来接住中文分词工具来更细致的提取短文本中的关键词
中文分词法提取关键词
我们打开微词云中的中文通用分析
这款工具是专门做文本分析的,提取关键词更适合
上面两种方式提取关键词就是在这里做铺垫的,我们要把上面筛选好的关键词,放入到这个工具中的自定义词典中
执行下一步系统就会自动帮你处理文本生成关键词分析报告
接下来可以下载特征词表,根据词进行人工分类
例如我这里研究的是食品类的,我根据关键词分了味道、口感、包装、活动4类你可以分类更多
短文本分类
我们接下来可以根据分类好的关键词给短文本进行分类打标了
往下滑动,我们找到“打标分类与关系图”
按照这里格式的要求上传分类和对应的关键词
最终点击开始打标就行了,会看到每条数据的打标关键词以及所属分类
根据上面的统计还可以做关系与统计可视化,有文本分类统计表、分类词云图、关键词分类表,以及关系网络图等
关于短文本关键词提取与文本分类就分享到这里,希望能真的帮助大家解决工作需求。
相关文章推荐
1、如何建立语料库?自己行业词库建立呢?
2、英文文本中如何提取英语词组,多个单词短语呢?
3、文本分析:中文通用分析中“打标分类与关系图”怎么做?
4、文本分析中,如何根据“关键词”快速查找所有相关句子或段落?