训练模型时候出错,有没有佬友指点一下

佬友们,最近在尝试自己训练一个快速的VITS模型,但是苦于技术力不够和没有文档,出现的问题无法解决, :tieba_087:询问chatGPT也得不到解决办法,想来请教有经验的佬友指点 :tieba_087:
项目地址:GitHub - ORI-Muchim/One-Click-MB-iSTFT-VITS2: MB-iSTFT-VITS2(Data Preprocessing + Whisper + Text Preprocessing + Making config.json + Training, Inference) ONE-CLICK
报错信息及上下文:



CUDA本来是12.6,但是重装11.7的CUDA也得不到解决, :tieba_087: conda内使用的py版本是3.8 :tieba_087:

16 个赞

train.txt内的文件按照readme的格式填写了,wav也分了段,并且没有无效内容 :tieba_087:

2 个赞

你在降级cuda之后重装过torch了吗

2 个赞

两个问题,第一个swpan事用于多卡环境的,看看环境是否符合要求,第二个报错显示除数是0,因此单步调试到那 len_buckets 是不是0. 另外楼上提及到的问题因为还在数据准备阶段,还尚未暴露出来,也要检查,win下dll(linux下 so)文件不一致,也会报错。

2 个赞

看你的第一个截图错误,不是找不到 weddy_train.txt 文件吗?

1 个赞

第一张图文件都没找到,试一试用绝对路径。

1 个赞

No such file or directory ./weddy_train.txt
integer division or module by zero
显而易见的是这两个,下面可能是由上面那个导致的,不是很清楚

你先看看你的配置文件对于的这个路径txt文件找不到
不行的话直接绝对路径试试

感谢佬友,我尝试修改了路径,但是还是报错





修改了txt路径,重装了cuda11.7环境,并且在conda内重装了pytorch的对应版本,但是问题还是存在

感谢佬友,我尝试修改了路径并且重装cuda,但是还是存在问题 :tieba_087:

感谢佬友,我是在conda环境内安装的,文档给的要求是py3.8,cuda和pytorch版本也符合要求 :tieba_087:

感谢佬友,降级cuda之后尝试了重装torch,但是依然回报相同的问题 :tieba_087:

错误没变,你单步调试吧,我感觉只是小问题,集中在数据准备阶段。另外spwan 涉及多进程和多卡,这个环境不单单指的是软件配置环境,还有硬件环境。一模一样代码在win和linux表现也不一样。

1 个赞

你这是另一个报错了吧:

File "integral low.py", line 528,
in rename config json
os.rename(old name, new name)
FileExistsError:
[WinError 183]
当文件已存在时,无法创建该文件。:’config:json’->’weddy. json'

不知道你代码逻辑是怎么样的,这里是weddy.json存在的原因。
要么删除weddy.json,要么重命名换一个名字