[文件操作] 大神会议：语音识别转文字

本帖最后由 locoman 于 2022-3-23 14:29 编辑

邀请大神汇聚于此，专题讨论研究一下：“语音识别转文字”

基本需求：
   一、将电脑声卡中的声音（包括扬声器和麦克风）直接识别后转成文字保存，最好能区分出是扬声器发出的声音？还是麦克风发出的声音？
      也就是说，不管是在WEB网页中直接播放的声音，还是各种聊天时的声音，只要启动了“语音识别转文字”APP，就能实现声音识别转文字，直到“语音识别转文字”APP关闭。

   二、可以直接将音视频文件中的声音识别后转成文字保存，最好能区分出或设定不同的对话角色。

研究重点：
1. 以FFmpeg解决为核心；
2. 以离线（勿需连接公网）解决为核心；

差点就很帅

列兵

Rank: 1

帖子: 7
积分: 23
技术: 1
捐助: 0
注册时间: 2020-10-29

2楼

发表于 2022-3-24 09:13 | 只看该作者

本帖最后由差点就很帅于 2022-3-24 09:20 编辑

说实话你这属于软件开发的范畴了，而且大部分语音识别都是调用成熟方案商的API接口，你要是懂编程可以去了解下百度的语音开源PaddleSpeech项目，或者去GitHub上看看有没有类似的开源，逛bat论坛的基本上都是不会编程的，不然随便整点python代码都比bat效率高的多。

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[文件操作] 大神会议：语音识别转文字

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]