- 帖子
- 290
- 积分
- 417
- 技术
- 1
- 捐助
- 0
- 注册时间
- 2011-1-20
|
本帖最后由 locoman 于 2022-3-23 14:29 编辑
邀请大神汇聚于此,专题讨论研究一下:“语音识别转文字”
基本需求:
一、将电脑声卡中的声音(包括扬声器和麦克风)直接识别后转成文字保存,最好能区分出是扬声器发出的声音?还是麦克风发出的声音?
也就是说,不管是在WEB网页中直接播放的声音,还是各种聊天时的声音,只要启动了“语音识别转文字”APP,就能实现声音识别转文字,直到“语音识别转文字”APP关闭。
二、可以直接将音视频文件中的声音识别后转成文字保存,最好能区分出或设定不同的对话角色。
研究重点:
1. 以FFmpeg解决为核心;
2. 以离线(勿需连接公网)解决为核心; |
|