写了一个高性能tts(文本转声音)工具,5千字仅需5秒,免费使用

地址 https://hub.docker.com/r/mzzsfy/tts

文本转语音工具,基于微软api封装,如果有 功能建议或者bug反馈,请到 GitHub - mzzsfy/Dockerfile: 一些针对第三方工程的dockerfile,部分文件可以配合另一个项目的白嫖github action

  • 流式下载,请求1秒就有响应,已经可以播放
  • 多线程,多个分片可以在服务器端同时下载

性能

使用默认参数,1k~5k字耗时约5~10秒

自定义分片大小和线程数可以继续提高响应时间,例如:
/api/tts?thread=10&shardLength=400&text=3000字文本 ,代表3000被拆分为400字一个分片,10线程,耗时约4秒

基于微软api

ps: 不同模型耗时差距很大

目前很很简陋,没有写web,只有api,不建议小白使用

124 个赞

能不能包装成安卓应用啊 :star_struck:

5 个赞

牛皮

4 个赞

后面写个简单的网页,然后你把网页添加到桌面应该能满足要求

5 个赞

我来支持一下

3 个赞

必须支持

3 个赞

下午把他给get了

3 个赞

你先试试看

3 个赞

调API的?

2 个赞

点赞点赞

2 个赞

牛逼

2 个赞

大佬太牛了,爱你

1 个赞

mark

2 个赞

支持支持

1 个赞

有xiaoqiu吗?

1 个赞

虽然没太看明白,还是支持一下

2 个赞

这速度属实可以。

2 个赞

相当可以了

1 个赞

厉害了

2 个赞

支持一波 :smiley:

1 个赞