- 帖子
- 62
- 积分
- 352
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2008-10-22
|
[文本处理] 用批处理能分析文本文件中自然词汇出现的频率吗?
本帖最后由 conglin58 于 2011-10-4 00:36 编辑
能分析文本文件中自然词汇出现的频率,然后按自然词汇出现的频率限制字数输出,用批处理不知道有办法实现吗???
2楼的兄弟没看懂啥意思!就把我完整的想法说说,因为硬盘里下载了很多rar的文件,一直都没好好做个分类,现在想要整理,在论坛里或百度找了大半天只找到一个按文件格式自动分类的批处理,不适合!
仔细看发现硬盘里这些rar文件的文件名五花八门的,连最基本的分类完全没头绪!靠手工整理的话实在有点力不从心!去天空下载站参照他们站的分类来整理也觉得不行!不太适合自己用!
目前我把所有的rar文件都复制集中到一个文件夹内,然后希望利用批处理或vbs的强大完成以下:
1.自动读取文件夹目录并生成文件列表file.txt
2.统计出file.txt文件列表内的词汇按出现最高频率的提取关键词并创建分类文件夹,限制字数4-8个字以内
3.按创建的分类文件夹名称自动整理所有的rar文件
第二步简单点说就是像很多新版的pw或dz论坛发帖时能自动提取文章关键词的那功能,希望版主或程序高手能帮忙! |
|