0x24a's personal blog.

文章分类

默认分类

最新文章

逆向工程了YAMAHA的Vocaloid5项目文件格式只是一个RSS验证 HAPPY MIKU 2024 BIRTHDAY!!! WarpPlusKeyGenerator-NG 使用方法一种使用少量声音样本制作高质量TTS换音色模型/UTAU声库的方法你猜我为什么要给评论区开Turnstile 记一次域名被ServerHold 免费获得 WARP 的小技巧记给SBLang2C实现跨文件导入的过程好玩的Discord

最新评论

cmd1152: 这验证码有时候一点就过，有时候几个小时都过不去 CMuidar: 啥后缀？注册局不一定是icann。 NIHAO: 我要使用24a的声库学日语） 0x24a: 话说听说部分人过不了cf验证？有够玄幻的…… 0x24a: ovo 0x24a: test cf auth avuwaqozus: Get your TB medication qu... irowmebe: Join our community to get... oqecomao: Quickly secure your medic... RandallJep: Proxy servers act as inte...

按月归档

May 2025 September 2024 August 2024 April 2024 November 2023 August 2023

常用标签

技术 warp+ 通知娱乐 SBLang2C Python

友情链接

纸片君ee的博客

一种使用少量声音样本制作高质量TTS换音色模型/UTAU声库的方法

2024-04-19 |0x24a | 默认分类

事先叠甲
流程简介
具体步骤

在学校实在无聊，晚自习拿出了草稿纸开始头脑风暴。
最近试玩了 So-VITS-SVC 并且通过批量推理的方式给自己做了高质量的 UTAU VCV 声库，但整个录制过程过于困难（录制训练 SoVITS 的样本所花费的时间约为 2 天），于是想到了一种懒人方法来训练 TTS SoVITS 模型的方法。

事先叠甲

本篇教程仅提供 大体思路 ，对于部分操作步骤（如使用 Google Colab 进行训练、文中提到的开源软件的具体使用方法），请发挥你的 Geek 精神：读文档、善用搜索或自己摸索。

流程简介

录制原音声（ 2 分钟 即可达到 非常优质 的效果！）
训练 GPT-SoVITS 模型
使用大量随机语料，生成净时间约为 3hr 的训练样本
使用 GPT-SoVITS 的输出训练 So-VITS-SVC 模型
(Optional) 下载任意 UTAU 声库并通过批量 Infer 以制作高质量声库

具体步骤

W.I.P.

respond-post-12

NIHAO

April 24th, 2024 at 07:28 pm

我要使用24a的声库学日语）