如何分析多个文本异同,趋势变化分析?如共有词,独有词,词变化量、累计量等?
很多时候,我们需要对多份文本进行比多分析
如政府多份工作报告、电商每个季度评论分析、多份相关文本分析等
通过比多,我们可以挖掘文本之间的变化、一致性和预测趋势等
好了,我准备了是乡村振兴的19年、20年、21年数据,用来做比对分析研究文本异同之处
那么是否有一个工具支持我们这么做呢?其实是有的
在线多文本比对工具
我们打开微词云的中文通用比对分析工具
使用方法也很简单,上传要比对文本的wcy文件就可以了
如何获得每个文本的wcy文件?
非常简单,wcy文件是微词云独有的文件而已
我们需要使用中文通用分析工具,上传文本,生成报告后,就可以下载wcy文件了
做比对多份文本的同性分析
上传好三个wcy文件后,我们就可以进入到报告里面了
我们先来看下单词交集位置,这里是三份文本共同出现的高频词表
可根据右侧侧的词表统计位置,查看共同出现次数做多的词有哪些
左侧是共有词与文本的词汇的占比统计
中间是共有词云图信息
共有词趋势变化
同时我们还可以点击共有词查看共有词的趋势变化,可以看多年的词汇趋势
如果数据量够大,按照一定规则,我们还可以推测未来几年的词的变化情况
文本差异性分析
基础信息差异
我们在报告顶部位置,左侧可以直接看到文本的大小、字数、总词数、特征词数、有效条数据、词密度、平均句长等信息的差异变化
右侧可以看到词性占比之间的差异,词性占比可以帮助我们更好地理解文本的语言特征差异
文本独有词分析
我们还可以通过文本之间独有的词分析文本的特点,你可以观察政策的更新、修改和调整,从而了解政策的发展轨迹
例如我们查看新出现词与消失词分析
我们可以查看下19年有哪些独有词,我们可以这样查
参照任务1选择19年,参照任务2可以选择20年
最终我们查消失的词就行了
从19年到20年消失了哪些词可以证明19年存在的词,而20年并不存在
并且上面的表格数据中,所在任务只看包含19年的数据的,证明19年独有的数据而不再其他文本中出现过
而右侧统计表已经帮助统计好了每份文件的独有词了
如独有词数量折线图和具体的词表
变化趋势分析
变化较大的词趋势分析
在查询单词以及变化趋势功能模块
我们会看到几个重要指标
如总次数、平均次数、总条数、平均变化和最大变化
那么我们可以研究的点就比较多了
如,我们想研究这三个文本变化最大的一些词的趋势情况
变化大的词表明政策的决策的方向改变,所以很重要的
我们先勾选这三个文件,然后在根据最大变化倒序排列,选择几个词来做比对
这里注意的是:提前取消系统默认好的单词,点击清空选择就好
出现频次较高的词变化
我们还可以根据出现总次数最大倒叙排列来选择关键词来分析变化趋势
累计变化最大的词分析
我们还可以根据变化累计量来分析关键词的变化趋势
操作上和上面一样,把累计变化值倒叙排列进就行了
右侧有很多展示变化表,大家可以自己慢慢查看哦
其实还有很多功能没有说明,大家可以自己进一步探索,多个文本比对可挖掘的信息很多,这款工具还有很多不足,希望多给微词云提一些需求建议!
相关文章推荐
1、多文本比对分析报告怎么做?
2、除了“ROSTCM6”高校师生更青睐的文本分析工具来了!
3、文本分析中,如何根据“关键词”快速查找所有相关句子或段落?
4、文本分析之多份文本词频分析比较