Board logo

标题: [文本处理] GNU Awk 3.1.7 (支持 UTF-8/SJIS/EUC/ASCII 编码) [打印本页]

作者: tmplinshi    时间: 2012-11-17 10:55     标题: GNU Awk 3.1.7 (支持 UTF-8/SJIS/EUC/ASCII 编码)

示例:删除同一行中的重复字符

E:\我的文档\桌面\gawk-mbcs-win32-20091124>type a.txt
锘?&鈥⒙仿?釡ㄢ攦锛庘敮鈹傗攬梅鈭斤骏+鈭仿р€曗€测壆鈭?鈮?锛?鈭氣晲鈽嗏檧鈾傦复鈭粹懅鈶犫懃 鈩冣棆锛婏紜脳锛傘垾鈹涒敆鈹撯攺鈺勨劇鈹佲敺 鈺斺攨鈺椻暆鈺歘夂寏锝烇拷鈭?&鈥⒙仿?釡ㄢ攦锛庘敮鈹傗攬梅鈭斤骏+鈭仿р€曗€测壆鈭?鈮?锛?鈭氣晲鈽嗏檧鈾傦复鈭粹懅鈶犫懃 鈩冣棆锛婏紜脳锛傘垾鈹涒敆鈹撯攺鈺勨劇鈹佲敺 鈺斺攨鈺椻暆鈺歘夂寏锝烇拷鈭?&鈥⒙仿?釡ㄢ攦锛庘敮鈹傗攬梅鈭斤骏+鈭仿р€曗€测壆鈭?鈮?锛?鈭氣晲鈽嗏檧鈾傦复鈭粹懅鈶犫懃 鈩冣棆锛婏紜脳锛傘垾鈹涒敆鈹撯攺鈺勨劇鈹佲敺 鈺斺攨鈺椻暆鈺歘夂寏锝烇拷鈭?&鈥⒙仿?釡ㄢ攦锛庘敮鈹傗攬梅鈭斤骏+鈭仿р€曗€测壆鈭?鈮?锛?鈭氣晲鈽嗏檧鈾傦复鈭粹懅鈶犫懃 鈩冣棆锛婏紜脳锛傘垾鈹涒敆鈹撯攺鈺勨劇鈹佲敺 鈺斺攨鈺椻暆鈺歘夂寏锝烇拷鈭╋
E:\我的文档\桌面\gawk-mbcs-win32-20091124>iconv -f utf-8 -c a.txt
:&· ┃.┯│┈÷∽¥+∷§―′≮∮ ≡'$$√═☆♀♂︴∴⑧①⑥ ℃○*+×"㈥┛┗┓┏╄℡━┷ ╔┅╗╝╚_~~∩:&· ┃.┯│┈÷∽¥+∷§―′≮∮ ≡'$$√═☆♀♂︴∴⑧①⑥ ℃○*+×"㈥┛┗┓┏╄℡━┷ ╔┅╗╝╚_~~∩:&· ┃.┯│┈÷∽¥+∷§―′≮∮ ≡'$$√═☆♀♂︴∴⑧①⑥ ℃○*+×"㈥┛┗┓┏╄℡━┷ ╔┅╗╝╚_~~∩:&· ┃.┯│┈÷∽¥+∷§―′≮∮ ≡'$$√═☆♀♂︴∴⑧①⑥ ℃○*+×"㈥┛┗┓┏╄℡━┷ ╔┅╗╝╚_~~∩
E:\我的文档\桌面\gawk-mbcs-win32-20091124>gawk -W ctype=UTF8 "BEGIN{FS=\"\"}{delete _;for(i=1;i<=NF;i++){if(!_[$i]++) printf $i};print\"\"}" a.txt | iconv -f utf-8 -c
:&· ┃.┯│┈÷∽¥+∷§―′≮∮≡'$$√═☆♀♂︴∴⑧①⑥℃○*+×"㈥┛┗┓┏╄℡━┷╔┅╗╝╚_~~∩

E:\我的文档\桌面\gawk-mbcs-win32-20091124>


http://bcn.bathome.net/s/tool/index.html?key=awk




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2