kkx小编给大家分享的中文词频统计工具是一款功能强大的中文文本分析工具,可以实现中文词频统计、词云生成、关键词提取等功能。能够准确统计Word文档、网页文件或文本文件中,基于词典匹配算法,支持多种分词模式,并且性能高。当我们由于一些工作原因只能借助独立的词频统计软件,此时你可以使用kkx推荐的这款词频统计工具,效果佳,性能好,喜欢的朋友不要错过了哦!
中文词频统计工具功能
全量统计方式:即统计给定多个文档中的所有词汇的出现词频;
指定统计方式:只统计指定的某些特殊词汇的出现词频。
(注:可以选择只统中文词汇、英语词汇或标点符号。)
中文词频统计工具使用说明
1、在文本框中输入(或粘贴)中文或者英文文章,然后按“开始拆分并统计”按钮即可查看拆分结果和频率统计结果。可以生成两种拆分结果:
(1)是按照原文顺序列出单词或句子;
(2)按照单词或者句子的拼音顺序排好序,当然,也可以通过打开文件的方式导入文章。
2、输出方式中也可带上编号。
3、在频率分析栏中可以通过点击列表标题,可以进行“编号”、“单词”、“出现频率”的排序—正序或逆序。
4、分析排序结果可以保存为txt文件,供大家后续继续分析。
中文词频统计工具常见问题
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。
更新日志
v3.16更新日志
新版本Bug修正,优化。
以上便是KKX小编给大家分享介绍的词频统计工具!