openai的whisper模型,可以用llama.cpp作者的版本,跑c语言量化版本,支持多种语言的封装。
支持加载其他模型实现多个人语音分开识别,支持多种语言,支持时间戳,支持分句子分词语。
2025年了,还有人不会用免费的ai吗?。
上一篇:Gemini 2.5 Flash 和Pro稳定版上线,和之前版本相比,在性能和应用场景上有哪些提升?
下一篇:为什么开发一个 AI Agent 看似容易,但真正让它「好用」却如此困难?技术瓶颈主要在哪里?