简单教程。给 newapi，OpenWebUI 接上语音对话功能

ageg · 2024 年12 月 27 日 11:16

newapi 的 docker-compose。如果没有用newapi，也是类似的，把tts这项加到openwebui的docker-compose里

version: '3.4'

services:
  new-api:
    image: calciumion/new-api:latest
    # build: .
    container_name: new-api
    restart: always
    command: --log-dir /app/logs
    ports:
      - "3333:3000"
    volumes:
      - ./data:/data
      - ./logs:/app/logs
    environment:
      - REDIS_CONN_STRING=redis://redis
      - SESSION_SECRET=random  # 修改为随机字符串
      - TZ=Asia/Shanghai
    depends_on:
      - redis
      - tts
    healthcheck:
      test: [ "CMD-SHELL", "wget -q -O - http://localhost:3000/api/status | grep -o '\"success\":\\s*true' | awk -F: '{print $2}'" ]
      interval: 30s
      timeout: 10s
      retries: 3
    extra_hosts:
      - "host.docker.internal:host-gateway"

  redis:
    image: redis:latest
    container_name: redis_newapi
    restart: always
  tts:
    image: mzzsfy/tts
    container_name: tts
    restart: always

newapi添加渠道：
代理：http://tts:8080
模型：tts-1
密钥：随便填一个
openwebui 填写语音配置
语音转文本用硅基流动的免费模型，填硅基流动的地址和key
模型名：FunAudioLLM/SenseVoiceSmall

wechat_2024-12-27_191637_1002247×699 27.9 KB

文本转语音填newapi的地址，我整理了一下可选音色

ShortName	Gender	ContentCategories	VoicePersonalities
zh-CN-XiaoxiaoNeural	Female	News,Novel	Warm
zh-CN-XiaoyiNeural	Female	Cartoon,Novel	Lively
zh-CN-YunjianNeural	Male	Sports, Novel	Passion
zh-CN-YunxiNeural	Male	Novel	Lively,Sunshine
zh-CN-YunxiaNeural	Male	Cartoon,Novel	Cute
zh-CN-YunyangNeural	Male	News	Professional,Reliable
zh-CN-liaoning-XiaobeiNeural	Female	Dialect	Humorous
zh-CN-shaanxi-XiaoniNeural	Female	Dialect	Bright

这样的话，openwebui的语音对话就可以用了。一句一答

感谢大佬

Houyinx · 2024 年12 月 27 日 11:22

感谢大佬的教程

syclove · 2024 年12 月 27 日 11:57

不错，又多了一个新玩具

F-droid · 2024 年12 月 27 日 12:29

直接连是不行吗?我没有打通过

ageg · 2024 年12 月 27 日 12:37

也可以。但是Ubuntu上还要配置防火墙，写在一起最简单

F-droid · 2024 年12 月 27 日 12:39

我是公网部署的，TTS可以，为我用的是它默认的whisper模型识别的，模型也能返回文字，还是通话时就是不会自动读出来

handsome · 2024 年12 月 27 日 12:48

感谢大佬教程

diff · 2024 年12 月 27 日 15:44

谢谢分享，有空试试

fx318 · 2024 年12 月 28 日 00:52

感谢大佬的教程

awyme · 2024 年12 月 28 日 01:11

这个可以有

user137 · 2024 年12 月 28 日 01:16

这个可以有，学习了

opennex · 2024 年12 月 28 日 02:27

good good study,day day up!

shiyi778 · 2024 年12 月 28 日 12:31

申请媒体权限被拒绝怎么办

midpoint2005 · 2024 年12 月 30 日 00:50

这个不错，新功能可以玩玩

haso2007 · 2024 年12 月 30 日 03:30

你需要https登录，套个反代吧

kilnlger12 · 2025 年1 月 5 日 03:26

请问，我问的时候可以语音输入，但答的时候只能文字输出，这是哪里的问题？

ageg · 2025 年1 月 5 日 03:29

tts的问题，回答里有个朗读功能就是用tts的，你测测能不能用

kilnlger12 · 2025 年1 月 5 日 03:46

确实用不了，有什么办法吗

ageg · 2025 年1 月 5 日 04:59

那你要检查一下tts容器的日志

zhiy · 2025 年1 月 5 日 05:39

佬，反代是什么意思

话题		回复	浏览量
我的TTS没人用了，再发一下，可自部署的文本转语音服务（微软音源）福利羊毛 TTS	39	2082	2025 年1 月 25 日
tts工具已支持openai接口参数,5千字仅需5秒,已经搭建服务免费体验资源荟萃 OpenAI , TTS	148	6132	2025 年1 月 8 日
chatgpt-web-midjourney-proxy多合一多平台ai部署器资源荟萃 ChatGPT , Copilot , 人工智能	23	1573	2025 年1 月 22 日
一个文字转语音平台资源荟萃 TTS	46	1892	2025 年1 月 3 日
tts 工具更新,已修复国内服务器无法使用问题,顺便修复一些bug 开发调优 TTS , 软件开发	29	799	2024 年12 月 24 日

简单教程。给 newapi，OpenWebUI 接上语音对话功能

相关话题