Board logo

标题: [文件操作] 如果批量搜索PDF中带有关键字的页面并提取(或截图)该页面 [打印本页]

作者: 城外无诚    时间: 2021-9-3 17:34     标题: 如果批量搜索PDF中带有关键字的页面并提取(或截图)该页面

例如在E盘目录的“人员”文件夹中有一个名为“社保”的PDF文件(页数在200页以内)。该PDF文件包含了公司所有人员的社保缴纳信息,页面内容主要包括序号、姓名、社会保障号码、险种、缴费情况、缴费月数等。
目前通过使用Adobe Acrobat Pro DC可搜索关键字(员工姓名)所在页面,但只能一个姓名一个姓名搜索并截图,比较费时。
比如我现在要搜索50个人的社保信息,并将这50个人社保信息所在页面提取(或截图)出来,有没有什么办法能做到批量处理?
个别人员的社保信息会体现在两页内容中,也就是该PDF文件有会出现该人姓名2次。
作者: newswan    时间: 2021-9-3 17:55

pdf 先转成 txt
作者: 城外无诚    时间: 2021-9-4 09:17

回复 2# newswan


    您好,转txt之后该怎么操作呢?
作者: newswan    时间: 2021-9-4 15:38

转txt用bat处理
作者: 城外无诚    时间: 2021-9-4 20:27

回复 4# newswan


    bat处理的话,我只知道findstr能做到批量搜索关键字,提取(截图)页面的需求还是没有解决。
作者: newswan    时间: 2021-9-4 22:28

回复 5# 城外无诚


用 for 语句,论坛有教程
第三方 grep sed  awk 更强大




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2