|
|
发表于 2015-12-1 22:04:46
|
显示全部楼层
建立数据库,
D:/数据/内有210个文本,命名为001 002 ... 210,每个文本内有若干行18列数据,格式为 9 3 4 0 1 5 7 1 2 6 5 1 8 2 3 6 4 6
为数据库建立 210 个表(每个表都只用一个字段), 这些表分别保存上面说的 210 个文本的内容, 行行对应
D:/数据库/内有18个子文件夹,命名为1 2 ... 18, 每个子文件夹内有10个文本,命名为 0 1 ... 9, 每个文本内有若干行数据,格式为...
再为上面说的 180 个文本文件创建 另 外 180 个表, 每个表也只用一个字段, 行行对应的方式把数据都存入数据库
210 个表中的内容也就是指定 每次 要用来检索的 18 个源表名, 算出这 18 个表名后, 将 18 个表的内容全部合并(重复的只保留一行), 并排序, 结果存入 另一个独立的表 TmpFullData 中
遍历取出 TmpFullData 表的每一行数据, 把这个数据在 那 18 个表中逐个检索并计数, 匹配计数达 7 个, 或者 不匹配计数达 12 个 , 结束, 存结果(不匹配计数达 12 个无结果)到结果表中
以上用粗略的语言描述的 数据库 的算法, 应该比文件处理方式效率要高, 具体代码就不要问我写不写了 |
|