 
- 帖子
- 423
- 积分
- 817
- 技术
- 2
- 捐助
- 0
- 注册时间
- 2008-11-24
|
[解决]40元求unicode文本提取
本帖最后由 lxh623 于 2020-8-4 17:59 编辑
文本a和tmp都是UTF-8编码。
文本a的格式是中文字符或者偏旁部首,用制表符分隔。每一行一个到四个。(考虑平时别的应用,加了一个。)
用文本a的每一行的几个元素,不考虑顺序,搜索文本tmp,如果都有,写入文本b(UTF-8)。写入格式是“\1\2\3\4\t+tmp那一行”。文本a的每一行搜索到没有为止。(一行可能有多个结果!!)
文本a可能有一万行,tmp可能有九万行。
谢谢! |
|