- 帖子
- 110
- 积分
- 167
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2012-2-23
|
BCKL2014-C11 BBHN710AD@F4BD000283_ABCDE1410310054000@519414 20180 T 6 2 116 12 6 2 2 B L 524 597 27.0
REAL2015-133 CCTE -CE-Y-P CBD5032.41@C4JD000041_ABCDE1403010010000@13123097 0.75 1580 1785 290 4815 2 0 23 22 5 51 197 318 38 2.02 0.21 OK 112 56 56
JDN2C-TT-B CR4@M4EC006609_ABCDE1407060007300@14201432 0.615 880 CTYL 8460 11 140 8 80 33 152 292 47 2.76 0.56 OK 144.0 71.0 73.0
E4T0000613_CSSAT1411130011600@14210519 0.75 1420 COIL 2190 2 4 14 15 7 38 165 309 44 66 33 33 FGCG+TT
E4T0000613_CSSAT1412240032800@14210519 0.95 1520 COIL 2150 2 4 14 15 7 38 267 319 45 66 33 43 FGCG+TT
前三组都有2个@ 表示数据完整不要动他 最后2组只有一个@
需要把FECG+TT 剪切到数据的最前面 加上@ 数据就完整了 最后的效果如下
FGCG+TT@E4T0000613_CSSAT1411130011600@14210519 0.75 1420 COIL 2190 2 4 14 15 7 38 165 309 44 66 33 33
FECG+TT@E4T0000613_CSSAT1412240032800@14210519 0.95 1520 COIL 2150 2 4 14 15 7 38 267 319 45 66 33 43
然后对上面五组数据做重复就删除的操作 还是用最后2组来举例说明
FGCG+TT E4T0000613_CSSAT1411130011600 14210519 0.75 1420 COIL 2190 2 4 14 15 7 38 165 309 44 66 33 33
FECG+TT E4T0000613_CSSAT1412240032800 14210519 0.95 1520 COIL 2150 2 4 14 15 7 38 267 319 45 66 33 43
重要1 重要2 重要3 无关紧要
重要1和重要3做比较 出现重复的 只保留一行 很明显 FECG+TT和14210519 两组数据都出现了 所以只保留一行就可以了 最后的结果是
FGCG+TT E4T0000613_CSSAT1411130011600 14210519 0.75 1420 COIL 2190 2 4 14 15 7 38 165 309 44 66 33 33
文本大概有200多万行 300多M 希望大神能用最快速的办法帮忙解决一下 谢谢 |
|