0x24a's personal blog website.

文章分类

最新文章

一种使用少量声音样本制作高质量TTS换音色模型/UTAU声库的方法你猜我为什么要给评论区开Turnstile 记一次域名被ServerHold 免费获得 WARP 的小技巧记给SBLang2C实现跨文件导入的过程好玩的Discord 记博客安装踩坑&避坑新博客已上线

最新评论

cmd1152: 这验证码有时候一点就过，有时候几个小时都过不去 CMuidar: 啥后缀？注册局不一定是icann。 william tata: buy ruby cart online Whit... NIHAO: 我要使用24a的声库学日语） IGETCARTSFORSALE: resolute-200-rifle-mk4-22... 0x24a: 话说听说部分人过不了cf验证？有够玄幻的…… 0x24a: ovo 0x24a: test cf auth qatwibob: Navigating treatment opti... uevulusula: Get your desire enhanced ...

按月归档

April 2024 November 2023 August 2023

常用标签

技术通知娱乐 SBLang2C Python warp+

友情链接

纸片君ee的博客

您正在查看：2024年4月

一种使用少量声音样本制作高质量TTS换音色模型/UTAU声库的方法

2024-04-19 |0x24a

在学校实在无聊，晚自习拿出了草稿纸开始头脑风暴。
最近试玩了 So-VITS-SVC 并且通过批量推理的方式给自己做了高质量的 UTAU VCV 声库，但整个录制过程过于困难（录制训练 SoVITS 的样本所花费的时间约为 2 天），于是想到了一种懒人方法来训练 TTS SoVITS 模型的方法。

事先叠甲

本篇教程仅提供 大体思路 ，对于部分操作步骤（如使用 Google Colab 进行训练、文中提到的开源软件的具体使用方法），请发挥你的 Geek 精神：读文档、善用搜索或自己摸索。

流程简介

录制原音声（ 2 分钟 即可达到 非常优质 的效果！）
训练 GPT-SoVITS 模型
使用大量随机语料，生成净时间约为 3hr 的训练样本
使用 GPT-SoVITS 的输出训练 So-VITS-SVC 模型
(Optional) 下载任意 UTAU 声库并通过批量 Infer 以制作高质量声库

具体步骤

W.I.P.

你猜我为什么要给评论区开Turnstile

2024-04-04 |0x24a

2024-04-04T05:24:33.png
自动评论机器人能不能都 414 啊😓