生成速度怎么样?大概几秒?
7 个赞
7-8秒吧… 小白不会用. 上了参考音频,但是出来的感觉不像. 不知道要怎么搞
1 个赞
我这边速度还行,得看你上传的参考音频长度和要生成音频长度了
直接拖进去就可以了… 但是文本字数多了就卡死了…出不来
1 个赞
佬,模型这一步该下载什么模型,给个链接
前排围观支持一下
好,我去试试
感谢佬友分享,去试了~
测试跑通了,几个小坑提醒一下部署出问题的各位佬友:
- 对于下载好的 fish-speech-1.5 模型,如果使用
python -m tools.webui
的时候报No module named tools.webui.__main__; 'tools.webui' is a package and cannot be directly executed
错误,可以把指令换成
python tools/run_webui.py --llama-checkpo
int-path "checkpoints/fish-speech-1.5" --decoder-checkpoint-path "checkpoints/fish-speech-1.5/firefl
y-gan-vq-fsq-8x1024-21hz-generator.pth" --decoder-config-name firefly_gan_vq
- 主贴的腾讯云和 ngrok 的链接和文本写反了,直接复制链接文本去浏览器才能正常打开。
python ./tools/download_models.py
下载模型这一步是下载什么。。
下载fish-speech的推理用的模型文件啊
是不是楼上佬友那个,我下载了也是各种报错
是,下载以后应该放checkpoint里
pip install -e .
就是按了,pip install -e . 人麻了,各种缺失文件的。
佬,这个checkpoints/fish-speech-1.5 文件应该建立在根目录,还是在webui
文件下。