Board logo

标题: [问题求助] 飞桨OCR用powershell调用 [打印本页]

作者: 小白龙    时间: 2024-10-30 17:49     标题: 飞桨OCR用powershell调用

本帖最后由 小白龙 于 2024-10-30 17:51 编辑

我想用powershell代码来识别图片中的文字, 听说飞桨挺不错的, 搜索 www.powershellgallery.com 没有找到相关的库, 于是想到了nuget.org, 找到了一个C#库如下:
https://www.nuget.org/packages/PaddleOCRSharp
开源地址:
https://github.com/raoyutian/PaddleOCRSharp

但是不知道怎样在powershell中调用, 求大佬支招, 多谢

我以前好像见过一个exe的格式飞桨OCR识别, 也能支持命令行识别, 找不到资料了
作者: Five66    时间: 2024-10-30 19:46

参考 PaddleOCRSharpDemo
大概是
先加载对应的dll
然后new 一个 PaddleOCRSharp.OCRModelConfig
接着new 一个 PaddleOCRSharp.OCRParameter
最后用上面new出来的作为参数 ,new 一个PaddleOCRSharp.PaddleOCREngine后调用对应的method
作者: 小白龙    时间: 2024-10-30 19:58

回复 2# Five66


    用gpt试了好多轮都不能成功, nuget下载的包里好多文件, 不知道怎样配合使用
作者: Five66    时间: 2024-10-31 00:15

这边渣机器 ,弄不了 ,可以试试

paddleocrsharp
和其依赖
newtonsoft.json
paddle.runtime.win_x64
下载后的后缀缀改成zip ,然后解压后单独放进一个文件里


作者: 小白龙    时间: 2024-10-31 00:56

回复 4# Five66


    太感谢了, 大佬还没睡吗?

问题是我现在都不知道用nuget包中的哪些DLL文件
作者: Five66    时间: 2024-10-31 13:41

回复 5# 小白龙


   
主要是newtonsoft.json和paddle.runtime.win_x64中的dll
不知道就全弄出来 ,弄到跟ps1文件相同的目录
作者: 小白龙    时间: 2024-11-1 19:21

回复 6# Five66


    折腾了半天还是没有搞定,这个C#的dll看描述中要调用C++的库的, 太复杂了,

大佬能再帮试试吗? 看描述这库识别很快的,最新的版本还提速了
作者: 小白龙    时间: 2024-11-1 19:23

回复 6# Five66


    我只想识别下面这种的简单的验证码,英文+数字,五位的
用gpt真是搞不定,我试了上百次了

作者: 小白龙    时间: 2024-11-1 20:16

回复 6# Five66


    这里有个完整的项目,但是分在了几个cs代码中了, 但里面各种依赖是全的,下载的文件也很大,400多M,解压后不到1G
https://github.com/raoyutian/Pad ... main/PaddleOCRSharp
作者: 小白龙    时间: 2024-11-1 20:27

回复 6# Five66


    下面是python调用, 感觉比powershell简单多了
https://developer.baidu.com/article/detail.html?id=2699404
作者: Five66    时间: 2024-11-1 22:11

试试参考下图 ,有问题最好发图
https://www.nuget.org/packages/PaddleOCRSharp

作者: flashercs    时间: 2024-11-2 10:50

通过百度网盘分享的文件:PaddleOCRSharp.7z
链接:https://pan.baidu.com/s/11ho_W-jAUe6OAlACNAeq2g?pwd=he6a
提取码:he6a
作者: 小白龙    时间: 2024-11-2 18:52

回复 12# flashercs


    多谢大佬, 确实可以执行了, 但是为什么下面的图片会识别为一个"国"字?


识别准确率不高, 0和o分不清
作者: flashercs    时间: 2024-11-2 23:53

本帖最后由 flashercs 于 2024-11-3 00:08 编辑

回复 13# 小白龙


    ocr不是用来干这个的. 验证码 需要搞字库 深度学习.
最简单的方式是对接打码平台,花钱卖服务,就是让 真人 为你解码! 英文数字验证码 一般1元500次.
作者: 小白龙    时间: 2024-11-3 05:31

本帖最后由 小白龙 于 2024-11-3 05:40 编辑

回复 14# flashercs


    多谢大佬点拨, 确实如此,我搜索到了一个专门识别验证码的开源项目,但用powershell代码调用,总是识别为空,最近发现GPT太难用了, 几十轮,上百轮都解决不了问题
http://www.bathome.net/viewthread.php?tid=70050




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2