找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 20322|回复: 4

[文本处理] 判断每行半角逗号左右的词有没有重复的,只保留一个,再合并行

[复制链接]
发表于 2020-12-27 14:10:00 | 显示全部楼层 |阅读模式
本帖最后由 ourpage 于 2020-12-27 14:53 编辑

一个文本文件里面有多行文本,格式是utf8。

比如:
批评,数落,批判
谴责,声讨,责备,批评,埋怨,责怪,批判,抱怨
僻静,偏僻,静谧,宁静,幽静,肃静,安静,寂静,沉寂,沉静
兴致勃勃,兴趣盎然,兴高采烈,津津有味,津津乐道,饶有兴趣
更多行...

第一行和第二行批评、批判这两个词是重复的,删除第一行的批评和批判,再把第一行的其他词合并到第二行,如果有多行,依次处理。
结果需要没有重复词,就是一个词只出现一次,最后按每行逗号前的第一个词的字数长短排序,字数多的排在前面。

结果:
兴致勃勃,兴趣盎然,兴高采烈,津津有味,津津乐道,饶有兴趣
谴责,声讨,责备,批评,埋怨,责怪,批判,抱怨,数落
僻静,偏僻,静谧,宁静,幽静,肃静,安静,寂静,沉寂,沉静
更多行...

麻烦高手帮忙看看,谢谢。
发表于 2020-12-28 09:36:41 | 显示全部楼层
此帖仅作者可见
 楼主| 发表于 2020-12-29 09:07:44 | 显示全部楼层
此帖仅作者可见
发表于 2020-12-29 14:18:32 | 显示全部楼层
此帖仅作者可见
发表于 2020-12-29 19:51:47 | 显示全部楼层
此帖仅作者可见
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-20 08:06 , Processed in 0.017461 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表