批量上传政策文档 · 汇总词频 · 支持 jieba 智能分词
支持 TXT / MD / DOCX,批量导入会自动合并内容进行统计
开启后会在统计时过滤这些词汇,使用空格分隔多个词。
开启后会根据哈工大同义词词林扩展版,将同义词统一为代表词参与统计。
示例:农村 农村地区 农村区域(一行一组,同组内空格分隔)。
农村 农村地区 农村区域
展示每篇文档的关键词权重(TF-IDF)。
自动对比每篇文档的独有词汇,以及全部文档都出现的共用词。显示数量为TopN设置数量。
开启后,“文档独有词汇”只统计相对于所选基准文档未出现的词。
选择一篇文档作为基准,其他文档的“独有词汇”将仅相对于此基准文档计算。
计算不同文本之间的余弦相似度,值越接近 1 表示文本越相似。
对全部导入文档执行 LDA,输出主题分布与关键词。
输入一个已出现的词汇,基于共现关系推荐语义相近的词。
统计中...