Constme-Whisper(离线语音识别) v1.12 – 九软分享-九软分享

Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。

Constme-Whisper可以在Windows上使用，支持高性能GPGPU处理，可以利用GPU加速处理。

本体是个启动器，需要结合一个语言识别模型文件（ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large）使用，模型越大，效果越好，但相对的速度也更慢。

软件特点

基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现，除了基本的操作系统组件外，没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度：Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器，用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础，支持大多数音频和视频格式（Ogg Vorbis除外），以及大多数在Windows上运行的音频捕获设备（除了一些专业设备，它们只实现ASIO API）。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API，nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件

Constme-Whisper(离线语音识别) v1.12

更新了文档和 GUI 中的模型源 URL
可靠性增强，麦克风捕获不太可能转换到“停滞”状态并丢弃音频

需要不低于Win8.1的64位Windows

文件main.exe为命令行调用工具

https://github.com/Const-me/Whisper/

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别