不管本科毕业论文还是博士毕业论文,有微词云内容文本分析不发愁!
本次想讨论下关于写毕业论文时文本分析方法与应用,通过运用自然语言处理、机器学习等技术,对论文文本进行深入挖掘与分析。
很多行业老师、学生借助微词云来辅助写论文中的预料文本分析,我想帮助大家做一个分析方法的总结,帮助大家捋清楚思路
01、文本基础分析
例如借助微词云做基础的切词、词频统计、关键词关联度分析和生成网络关系图、词序分析、文本数据定位
大家就可以使用这款中文通用分析工具来实现
具体操作,大家可以查看这个B站教程一款文本分析工具就够了!词频分析、共现分析、相关性分析、数据分析图表应有具有!
算法是大家熟知的jieba分词
02、语料库、行业词典建立
这一步其实非常重要,对于文本深度分析者来说
微词云中的新词发现就是专业辅助分析者挖掘新词长尾词的
新词发现:https://fenci.weiciyun.com/cn/findword
在这个B站视频有详细的提到如何建立预料:基于主题分析和情感分析,深入挖掘菜品评价数据的秘密
03、文本情感分析
微词云有英文和中文两款情感分析软件,
中文情感分析:https://fenci.weiciyun.com/cn/sentiment/
英文分析(包含情感分析):https://fenci.weiciyun.com/english/
其中中文情感分析,是基于情感词典方法来做情感分析的,结合了非常多知名的情感词库,所以拥有庞大的情感词库
准确率可达70~80%,大家可以通过自定义情感词的方式来提高情感准确率,准确率最高可达90%左右
如何提高情感分析准确率的博客点击这里
那么如何使用中文情感分析的查看这个博客文章
英文情感分析是基于模型算法的,功能也比较多
其中包好,情感正负面占比;条数据情感得分统计、极性统计、情感词抽取等;还有情感分析得分分布图等非常重要的分析数据结果表和图
大家可以查看这篇博客文章:1款英语文献分析软件·词频统计、情感分析、词组提取、关联度分析一网打尽!
04、词云图生成
貌似市面上有很多词云图生成工具,但微词云仍具有很多优势,例如单词显示大大小严格按照单词出现的次数来显示
有丰富的自定义修改配置,供大家进行美化词云图,支持多个指标参数生成词云图等。
词云图生成器工具:https://design.weiciyun.com/edit/
大家还可以查看B站这个教程微词云——高阶词云图生成器-吐血最全教程
05、主题分析
我们先说下主题数确定需要用到哪款工具
LDA困惑度主题数确定:https://fenci.weiciyun.com/cn/lda/topics/
其次是主题分析工具:https://fenci.weiciyun.com/cn/lda/topic/
操作指南大家可以查看这个B站教程:年度最爱的主题分析软件,在线就能轻松搞定LDA主题分析!
06、多文本比多分析
一些些政策或旅游等多个年份,月份的文本,做比较分析,研究差异性和同性的
你可以使用这款通用比对工具:https://fenci.weiciyun.com/cn/diff/
但目前这个是中文版的
大家可以具体参考这篇B站教程:搞定多文本比对分析-轻松完成高阶政策文本分析
今天是针对毕业论文文本预料分析的一个总结,希望能帮助到大家!