地址 https://hub.docker.com/r/mzzsfy/tts
文本转语音工具,基于微软api封装,如果有 功能建议或者bug反馈,请到 GitHub - mzzsfy/Dockerfile: 一些针对第三方工程的dockerfile,部分文件可以配合另一个项目的白嫖github action
- 流式下载,请求1秒就有响应,已经可以播放
- 多线程,多个分片可以在服务器端同时下载
性能
使用默认参数,1k~5k字耗时约5~10秒
自定义分片大小和线程数可以继续提高响应时间,例如:
/api/tts?thread=10&shardLength=400&text=3000字文本 ,代表3000被拆分为400字一个分片,10线程,耗时约4秒
基于微软api
ps: 不同模型耗时差距很大
目前很很简陋,没有写web,只有api,不建议小白使用