Singing Voice Conversion via diffusion model
2022.10.26 修复windows上预处理数据在linux上无法使用的问题,更新部分文档
2022.10.25 编写推理/训练详细文档,修改整合部分代码,增加对ogg格式音频的支持(无需与wav区分,直接使用即可)
2022.10.24 支持对自定义数据集的训练,并精简代码
2022.10.22 完成对opencpop数据集的训练并创建仓库
查看./inference.ipynb
export PYTHONPATH=.
CUDA_VISIBLE_DEVICES=0 python preprocessing/binarize.py --config training/config.yaml
CUDA_VISIBLE_DEVICES=0 python run.py --config training/config.yaml --exp_name [your project name] --reset
详细训练过程和各种参数介绍请查看推理与训练说明
目前已经以opencpop数据集和猫雷直播数据集进行过训练,对应ckpt文件、demo音频和推理训练所需的其他文件请在下方QQ频道内下载
使用QQ扫描此二维码(如不能加入,请尝试一个合适的网络环境):
项目基于diffsinger原仓库、diffsinger(openvpi维护版)开发.
十分感谢openvpi成员在开发训练过程中给予的帮助。