
CapsWriter (离线识别语音输入工具)绿色版v1.0
- 软件大小:1GB
- 更新时间:2023/08/11
- 软件语言:简体中文
- 软件授权:免费软件
- 所属分类:媒体工具
- 适用平台:WinAll
CapsWriter一款本地离线语音输入识别工具,通过本软件可帮助用户快速高效的对输入的语音进行识别并导出。在CapsWriter软件中用户只需按下caps键即可进行语音的输入,软件会自动的对内容进行识别,识别结果会以彩色显示。
软件介绍
这是 CapsWriter 简陋的离线版,一个 PC 端的语音输入工具。
运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。
安装方法
安装 Python 后,在 cmd 窗口进入本文件夹,运行 pip install -r requirements.txt 安装依赖
sherpa-onnx-bin 文件夹中已经放置了在 Win10-64 端预先编译的 sherpa-onnx 二进制。
其它系统暂时需要按照 sherpa-onnx — sherpa 1.2 documentation 编译后,放入 sherpa-onnx-bin 文件夹。
使用说明
运行 01sherpa-onnx-server.py 脚本,会载入 Paraformer 模型识别模型(这会占用1GB的内存,载入时长约十几秒)
运行 02-CapsWriter-client.py 脚本,它会打开系统默认麦克风,开始监听按键
按住 CapsLock 键,录音开始,松开 CapsLock 键,录音结束,识别结果立马被输入(录音时长短于0.3秒不算)
注意事项
目前使用的模型是 Paraformer 非实时模型,即录完再转,因此录音时间越长,上屏延迟越大。
主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每 10s 录音需 0.6s 转录时长。
本地模型对算力要求非常低,基本无需担心性能问题
暂不支持标点符号,暂不支持逆标准化(如把中文数字转阿拉伯数字)
为方便用户检查录音质量、识别效果,脚本默认开启了保存录音,所有都被保存在了 audios 文件夹
软件截图
猜你喜欢
- 查看详情 AE扭曲变形插件 免费版v1.99.4134.69MB简体中文2023-11-01
- 查看详情 Proxy View (组件代理插件)官方版v1.03KB简体中文2023-11-01
- 查看详情 WPOPT (WordPress优化插件)免费版v1.3341KB简体中文2023-11-01
- 查看详情 ClassicDesktopClock中文版 最新版v4.31329.21KB简体中文2023-11-01