AI手机网 安卓改机 一键新机 SCRM工作手机销售 AI技术 群控软件 手机定制ROM

 找回密码
 立即注册
查看: 5597|回复: 5

[windows] DiffSinger使用教程 介绍 下载 (随时可能要过期版)(一)

[复制链接]
发表于 2023-1-26 10:14:06 | 显示全部楼层 |阅读模式
*本教程默认使用由OpenVPI团队维护的仓库
% @8 O" B. b9 U& [7 M4 z" ^
4 {5 |8 S) x) BGithub: https://github.com/openvpi/DiffSinger/tree/refactor" s8 l% @! `8 l4 c" ^
! j7 G' H3 g# v
*本教程参考了@深夜诗人 为Diff-SVC和SOVITS写的教程4 q4 n5 t9 z1 g; X7 R
' m3 Y2 \: [: `7 u! T
https://www.yuque.com/jiuwei-nui3d/qng6eg
: C0 @; @9 l( f0 t8 q% H" O, a& i0 R6 X" ~; j+ J2 c  V3 {
*受限于编辑次数,最新请访问
5 X" Q1 l6 Z; }% }2 n1 ~
+ P, g; N6 V" K! z- B2 Z! Bhttps://www.yuque.com/sunsa-i3ayc/sivu7h
/ S7 _8 [# U: L# ]5 W; a) s$ c; l, D. F2 M' ~, l
Part 1.设备准备
2 O0 }8 f/ f/ O+ e一、硬件要求0 u- }8 y' e6 c' C

# @+ o3 I2 R) l: a: o3 D模型分为数据集处理、模型训练、模型推理三部分
) I& ]" {) j: `( B( V+ w+ g& B( B  J' [6 K9 {
*由于标注还在高速迭代中,暂不提供数据集处理部分内容,本教程默认使用OpenCPop数据集(出于协议原因需要自行到https://wenet.org.cn/opencpop/申请)
( v3 {5 X6 c0 I5 ~/ h& u# ^2 ~0 b2 _, I- W* B* E. k
6 P1 N& V  U# m2 X! p: l

6 o% g, ]. z' f1.模型训练:, |+ {# i( v2 ]" Q
$ h$ i! W3 v( D4 ]1 _
要求6G以上显存的显卡(需要修改参数,不建议),常用服务器的V100(32G显存)、A100(40G或80G显存)等(Colab或自行找平台租用)
) |; j7 _& [7 K6 B9 K+ O: ~$ {& F8 z% @" O) B
Q:xxx平台能不能用?! h, l1 F& n7 @* c9 W

" b3 E# `* S8 x) lA:GitHub的代码一般Linux平台可用,训练不建议使用Windows
/ h/ a5 @( J* G+ H
: D! J3 C" N6 o- ]8 O6 D+ M, E2.模型推理:
+ K0 L0 x+ ~* I- h) f% a: K) V
" n+ \, Q+ l$ U. a* B/ o2 y实时速度指电脑每秒可以使用模型处理n秒的音频,如4分钟音频耗时1分钟处理完毕,实时速度为4x6 ^0 D$ e! D( O+ g

/ c2 t  l# p4 N加速推理为(部分!!!)模型自带功能,同硬件下牺牲音质,提高推理速度! M3 k5 n' Z) d% P8 c% U, M

8 G! u( W2 y8 L) I以i5-8300H为例,CPU的实时速度约0.1-0.5x,3分钟歌曲转换耗时5-30min不等
3 A% D* g5 K: [: s# N# j% x4 j' @! ?  ]) r: |- C  f* r$ {
以1060-6G为例,GPU的实时速度约1-10x(取决于不同模型和加速设置),3分钟歌曲耗时30s-5min' O# f# j. T' u' D* E! l

- {$ C: l( Q% Q* @: p" _6 I8 S因此推荐非NVIDIA显卡或显卡性能较差用户使用Colab进行推理(需要能正常访问Google)
8 H' B: j7 h) F8 Y6 v& @' M. w* b
& o, Q3 x0 }9 h, bhttps://colab.research.google.com/drive/121Bb5yos7O05kqs-gwOZAB8-UMBVy0hN
! R& R% \& _& k
& ~# z! @1 p) Z
: J' K" P5 q) y) U& |0 j7 g, ^3 H
/ l) e; v3 W7 D2 ~Part 2.环境前期准备7 {4 r9 s) p( p6 y. h, w1 C
*教程只在Windows 11 22H2下Python 3.8环境进行了测试,用于Windows系统下本地推理。- X4 g; O3 Y4 J: O1 R" X7 L- F
5 {- ]$ L; _+ D0 B& x4 I+ s
一、Anaconda安装(你也可以使用自己喜欢的其他程序)/ I% K( ~2 z/ v% A4 o0 H+ O; F' q
+ E7 N/ s8 L( j9 @$ S2 }3 p) x
清华源:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D
' P/ |4 Y/ `3 O2 m7 b
/ H5 _8 o' s0 D(目前访问可能下载较为缓慢)3 f* u+ `9 s# `* ]! K. I4 J1 D

: F) [( n2 R5 ~; F$ U/ ^, D1.下载Windows64版Anaconda- A3 ^- r7 o9 Y: L9 v/ Y) {
) Z+ x% y4 H7 \- \

* b" t2 @( ?( K* w& I2 u, N! l
0 B. \5 [& b  ?$ v0 mAnaconda下载
5 I  ^' V) N, J6 V: c2.默认安装在C盘即可3 g/ o' O# P1 ^& G

) @# H6 n1 s/ D3 _$ A安装时记得勾选:
# ]# r1 r3 j( z; t% @4 S; z
& e9 v4 j8 S1 d8 a9 f" J0 |把Anaconda加入系统环境变量。
- f! |* `- d/ N. R- J6 _- Q把Anaconda加入系统环境变量。# @4 j7 U) C: _5 b/ i
8 V2 ]  V- A2 y1 s6 R4 b
3.在开始菜单找到Anaconda的命令行打开
5 M# W: X; h% ?# ~, w  k! G2 K4 B  h8 @* ~
在开始菜单找到Anaconda的命令行打开) `5 A* }& V/ I; X& X) j  J* X
命令行
+ q0 b. s% j7 z" M1 ?9 C二、Anaconda的换源/ j" B. l0 |% {; X! F
' [' {9 T# I& p0 e
1.在命令行界面输入:. M* }7 {1 ^! K0 E: n
, i* H) c, t; z. k  `
conda config --set show_channel_urls yes
; W& L7 J) U/ m, p6 z
* z: h$ V( n1 s1 K. u* A9 g, Q" b按下回车键 $ J9 U9 b8 j2 ~( m# N$ b8 L

  w) p% L. r- c1 X; U' q) J2.接下来打开我的电脑
+ d. d* V3 I6 {% j% A2 S  |6 h% k6 U: X' f
进入C盘\用户\你的用户名文件夹,也就是C:\Users\xxx
4 ^. d. Y8 O: N' o; t2 Z
$ J; X% O- H5 _& W" o% axxx是你的用户名 8 O( B4 a+ B1 F) y' @2 J. x7 J
( ^0 C/ Q7 B% A5 D% N6 K2 H/ q
3.找到名为:.condarc的文件
! ^  _$ B3 t7 L4 i: @' v
6 S" e+ n0 t8 @" l0 w; q$ W% A用记事本打开
  e+ i4 i% R. E4 M/ d
2 s# ]. _, o( [; b4.删除里面原本的内容
) m  l- f; u) T" R% ~. i1 E  f5 W/ \, L5 j" S2 ^: |& |: J
将以下内容复制粘贴到里面点击保存 3 H7 s5 o/ s/ S9 n9 d
$ }+ ~* [) \* \6 c: G! g
channels:
. E. ^% a) Y# G; f2 ?- Q' ?& W1 J$ N* Z  M
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
! O; v  k1 q) B- d: p; `
( @3 e- S5 u5 H+ H- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/& W2 T4 R5 v0 g  v$ T' Z: x9 @

. P' ^( _# N3 n7 s  z- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
- J1 X; ~: Q9 A& K& ?* L4 W7 E7 u$ X9 u. H  m
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
& b4 o" j( \: P8 y8 C
4 p- b- @  s! e' l- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/# t4 x7 T5 ~9 k/ K

7 P+ l$ v: S5 b% Z% E, U- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/, e# B# ~6 S' K% p. R' \7 V4 |
7 @6 D8 C/ k3 U3 X( R  _% Z
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
5 p6 r- v* C) `7 z. D0 t0 g5 R0 u" y$ z$ l& p
- defaults0 u: z9 T2 g6 q% ^* b
; z' ]4 o' X+ i7 N8 n
show_channel_urls: true# O( _5 k9 r& u+ Z- [% H% o
: R. f2 R, E& E# q5 f
default_channels:
# I- E" P. \7 V6 {9 O( d/ ~
; X/ C7 E$ Q4 x# k* A' j8 c& D- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
6 Z, m0 O7 X% M" I' Y& H- Q' |# ^: q+ _
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
3 L. A, L+ w: w# Z1 L. ^7 P# L0 P, P, `9 X* D  e' ]+ s1 [
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys24 E/ q* i* h4 N' r
+ W. S+ x; b2 W+ n
custom_channels:: S' B: R2 s" j( B& d
. C6 F2 Y/ I: ~1 w2 @
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
, z1 h( Z4 s: Y' J1 I' D- H; R# W
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud1 t* m5 x! M4 q4 L: L: i4 j
" E. l4 L& w" Q6 s9 y
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
" M$ N! w5 x& I: [  @9 e; S/ k9 y' ]3 C6 A2 s
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
; ~8 W- K1 _7 y: f& C/ k( g. d
( K  j% d, H2 d8 U7 u! a7 Xpytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
& K. Y- y8 s' V6 z  V
6 I5 w& H' g5 I; A/ O' g8 gpytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
: A5 J% {" F# F2 r' \5 b" n; q9 i9 _7 Q4 D/ a9 }. W$ }
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
2 p  K. D. I. }' z$ _+ p9 j
% Q7 l2 [& B1 F; v) e  r! W# c% E' g' N, `' c5 m0 n, A
就像下图这样:5 u7 T% X% w# r: d. F
8 r& ~7 R# a( [
如图
, e* Z: ]6 l$ C三、Conda换豆瓣源(如果清华源过慢可以尝试逐条输入并回车)- r/ k# A4 a. _
' H+ P7 B0 _  v+ Q/ r* o
conda config --set show_channel_urls yes
+ e4 I2 ~: A+ c) n& z! `/ U  Z2 N2 j
' ~. `" }2 E) X, B+ m$ c# Gconda config --remove-key channels6 R+ ?3 h1 z9 s- K% e

3 D' c/ v# W2 ?  {0 y+ D, nconda config --add channels https://pypi.douban.com/anaconda/cloud/conda-forge/
% T$ G( Y- G5 ?" D/ a# s# e! E3 O9 U: R3 E( Q
conda config --add channels https://pypi.douban.com/anaconda/cloud/msys2/2 E' J5 x+ I& }& G3 F& I+ z5 I

- [7 h- f0 x* f2 }; _3 f+ Vconda config --add channels https://pypi.douban.com/anaconda/cloud/bioconda/
0 f% h# H9 v# U" e+ v, T
: w+ {# A1 Y+ [! @4 uconda config --add channels https://pypi.douban.com/anaconda/cloud/menpo/5 n# ~6 h+ l7 _& Z# K& O- w: T0 H+ y

+ w0 z$ k/ @' u9 N2 Tconda config --add channels https://pypi.douban.com/anaconda/cloud/pytorch/
. s' ^  @$ i9 i2 _
1 w$ {8 }/ m, u. }+ ~' E) O6 b" D; t. c2 Q
Part 3.推理环境配置; ~, I9 M: {' S; _2 b% D
为了避免和其他项目产生依赖冲突,我们需要为DiffSinger项目创建一个虚拟环境,该虚拟环境通用于接下来所有DiffSinger相关教程。# P9 v% r' [+ T: P! w

) p% @7 i- W. F1 s: K一、创建个Python 3.8的虚拟环境
; F: f% j: H7 X' l+ e/ q! B7 J' \7 ?. Y( C. s# v
1.输入:' t8 t3 T1 }7 Y& }

8 D0 S& \3 u& b5 Oconda create -n diffsinger python=3.8
/ s1 ?$ ^4 E4 I" ]0 X
2 d6 W$ b% _# |3 b: j) j  |$ S按下回车键 ,diffsinger是虚拟环境的名字可以换成任何英文和拼音名,只要你记得住就行。/ F3 E: T2 I0 Z7 }* u2 V
6 [/ e6 S, U7 D; A( \. N
% F, ~' T/ D/ ^5 a* }! G7 d
等待conda查找所需组件,完毕后会显示下图内容
7 e+ [/ M+ ~, R" j0 R, o
# U4 q& o/ ~, |# R9 Q% ]# K2 t8 B0 q9 t) q! a5 w
输入:
) u2 p. j  e  t& Z! s" }  F, _6 X  `4 }4 @; p
y " l# q  h7 R/ e0 f+ f

1 m& N: Y) b9 L按回车键开始安装,等待下载和安装完成
' a# V* F3 K$ r  s# t. x( }' j0 _# L/ Z) ~6 t. `+ \( C. K" Q
) w' O1 y- \5 i
- m6 r. S0 j$ E0 i6 Y. p
: C' j* r( Y# M+ }
输入:
& k9 j: z0 ~( g$ i2 ~4 _9 N- y
3 t7 E9 L% O! H3 p# q$ A# ^activate diffsinger
% {& ]' L  _, S8 V8 y& }
4 g/ j% U7 p) z: X# N% o! ?. @8 a7 u8 _回车,切换到刚刚创建的虚拟环境% g, d8 R4 L7 N* L

  c- {( A8 I# p& {# Y* h( e7 B每次重新打开conda终端都要切换到项目对应的虚拟环境,看到开头由base变为diffsinger就说明切换到虚拟环境了。
8 J1 y5 C0 X* d* K& U; F1 F3 q
* |+ }; T# B* m8 F! R4 x
" R. S: N( a7 Z6 t; l输入:& V" M  l4 b% Q4 n! M5 x% `
5 R6 \1 B" H; \4 o1 B& x
*这条代码并不适用所有人,需要根据显卡自行更改!!!
1 Q1 f) i. I/ c4 _! ^$ Q5 K! T* C
conda install pytorch torchvision torchaudio pytorch-cuda=11.6 -c pytorch -c nvidia/ O4 N; }# J! v1 [4 x6 b) j

" H  V2 ~, g7 L* J- S7 C6 g按下回车键,安装pytorch
; \. [* P  w5 U# C& E8 k/ t. n# J. k8 k. z2 ~2 c" y
- m* H+ C; B2 J5 V9 Y# K4 Y3 U9 p% d
(这里推荐根据你的显卡到官网https://pytorch.org/get-started/locally/ 下载)
' t6 |$ ]9 s. v, g' b# q  ^0 X3 z3 r8 ^6 p3 z
! |3 S- m* @( Z! O) x
(查看显卡支持版本可以在命令行输入 nvidia-smi 查询CUDA Version)0 ^- ?# ~- s' z) b- T; Q2 w1 V- O4 M7 o
: P% E& G, P. A" n4 @! R& W
+ T4 P3 u: j5 [( ~) w) w
等待conda查找完成输入:9 M! t1 s' N0 r8 f8 P

( n) V" A& s# \5 wy
, N: S' `. c2 {& F) d1 z
0 |5 l- ?# V0 U. t( w% z) \按回车键开始安装* m8 C8 W$ d& h7 M# H. ~
* p2 P8 J0 v) z1 R; s3 G9 }$ ^& X! c

9 ^1 Z# d/ U' H, m1 g- T: d等待下载和安装完成
5 ~3 |8 ], F: k- M' L
% U1 \2 ~' V) L; C
2 P$ E7 d$ x& WP.S.
2 A% ~. M$ c% P9 \! |" m, ^0 B6 m! k7 v7 E
Q:我的显卡显示CUDA Version低于11.6(可是显卡型号很新)怎么办?
' Q( v, k4 o! T9 L% J
+ g) d. {/ _; t/ B% e& D* UA:如果更新到最新NVIDIA显卡驱动后仍无法在官网找到对应版本下载,可以输入, A# D9 {# O" Y% E

1 |: z* N  {1 V/ R2 l  }conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3% }" i! N/ a! [$ w# A/ Y. Z

3 ?% {2 Y+ d/ ~3 c; g1 U下载11.3版本的Pytorch(再低就不建议本地推理了,可能不一定有CPU快)
( A1 s8 V9 E+ t) h, H( n" ?9 \0 E+ |. n( }
P.P.S.5 W5 e7 ?  [& l  S9 j6 r
7 |8 C, b( S7 m4 I4 s
Q:conda安装torch时候太慢了怎么办?
% i4 o* ?1 L3 }1 R1 _
7 \& s: |2 X$ ^' G, h& I7 {2 AA:可以下载群文件的torch.zip压缩包,解压到任意目录
3 r) C4 ^1 T, C8 `0 y, t: _1 I6 F; p2 t6 f
2 ]$ x# t% X7 Z+ A# v1 ^. J* Q6 B9 ]
conda输入:
+ O% W( b) K1 S3 U8 \8 H# Z% k
' P' v. Q7 J4 h, [$ e8 F: R( J; qactivate diffsinger
/ i0 z6 Q" O4 h8 W8 [$ F8 H
6 h! [4 T& }5 x' |# n( s( m切换到对应的虚拟环境(自己更改的命名)
! C" a# r6 ~, s4 c* \6 u) u9 s' B, [. N- Q
conda输入:
- V4 n, M- O* C; Y8 o/ X6 s0 p0 X  S' R
cd 解压的目录地址, N& P8 t/ L) F# M' O3 U
9 |% Q; g+ W3 D0 H
回车键切换到解压的目录(是你上面解压的目录)& I. n/ \/ v! q

5 O0 q* E- Q$ d. q3 i- r2 t- P* F. x这里如果你解压在非C盘路径,可能会出现cd后无变化的情况; }* q, y9 q) c1 ^5 L' }

  r: Z  S+ b) K4 ?. G
. y  L7 q3 {: @, s8 n2 d这时你可以输入对应盘符,例如
" q- `. \4 `. v7 B5 `2 s  G2 f$ b$ ~/ c; v, l0 d$ N0 H  l0 x
f:
# {& D7 M2 t# K/ r4 h4 }- {4 Q& R% l% |
回车% `+ g; V) |) h  t2 ?

+ _; I+ ?6 A: V2 M*请根据自己情况操作
, r9 }% V9 C$ O
  a4 m6 I5 w6 t6 k
; H+ n0 j6 w2 B8 K* cconda输入:
5 Q/ C$ B: U' N3 r4 B1 f& \& b1 F+ X: h$ f% b1 c
pip install torch-1.12.0+cu113-cp38-cp38-win_amd64.whl # }. B0 ~) f) N( a' L5 a6 o" Z

. Z- F* K, C5 V# l4 x. Q" T' E  k2 z& y回车等待安装完成, Z: j, [0 s2 _+ c# F
4 G* L' |- w- s- s% o/ B& n1 k3 H
pip install torchaudio-0.12.0+cu113-cp38-cp38-win_amd64.whl
" Z5 ]9 G& N' [# R# M
$ `: b9 G7 W1 z# U7 C. F* [' Q回车等待安装完成) j, r1 Q& d  [; e' h+ [- j
: N2 x. F  ^# w
pip install torchvision-0.13.0+cu113-cp38-cp38-win_amd64.whl
$ M) {5 x" F+ k" g) V! }$ ]0 W" N. H! g% ?/ m' y  J& O
回车等待安装完成2 z; X; ?& a0 X# {4 Z

) O/ G8 t; Y) h  v- q) c" E" B一共安装三个文件/ }! ]; s7 S) Z9 J1 a

1 F7 Z8 S  I& e' q3 F+ a' j- Q$ J+ ^0 F- h( g
7 r# y7 l7 Q2 x/ w9 \! N3 I
为了确保安装版本的正确,可以逐条输入并回车以下代码2 B1 B; B0 b/ ~  a5 F  e, ?8 b2 M

: x- Y/ e7 s) |python( \! x' P% p) D2 E) }* X
- l$ [* f& P1 o
import torch0 M# h3 s" M" b/ z
print(torch.__version__)  @7 M- l* Q0 x3 F, u
print(torch.cuda.is_available())  - R, S7 @7 |" j1 `$ ]: b9 K
进行检验
5 F2 z+ [% S2 G& Z* e) ?: }
; d: W  q1 A7 K5 S5 [) {' B" a/ O  Z' l
如图返回True说明正确安装GPU版本torch
: Z7 b1 o5 Z( n+ K  w3 D4 z6 g7 R9 E6 {8 e! b9 \: ]  B
然后可以输入
$ V3 _8 c% R3 Q- z$ z  y" q9 }/ C$ i( Q* ^' F9 U  C8 C" N
exit(); [1 U0 u( o* s3 Q

+ x; t3 I7 C" R" v- N+ O2 y4 h) A退出Python% N; }0 S0 [" ^4 q$ {
3 h% I! O, A3 K
8 Y: h; e% U3 D% B5 e5 b5 W

7 w5 b" [) J7 l7 E) z6 J% J, B) f6 @2 a0 @
* U( Z1 ~/ B0 T
OpenVPI团队维护的DiffSinger仓库地址8 ^8 k( r/ s. b3 G4 e2 u$ o; i
; P& }& j5 v/ c7 Y* E: ~
https://github.com/openvpi/DiffSinger/tree/refactor: N- F- V3 ^6 J( F& c5 E
1 A0 }3 V% {7 X9 w" s5 D9 t7 r" h8 l
(能够流畅访问GitHub的用户推荐使用git clone以便以后获得最新更新)
) V; ^5 C5 M* O! \5 v
, X* m; E5 |" m% W9 ^1 f& ~" ~9 {9 D点击code下载zip
" U* z" J" Z% S" o1 p8 _' j  o, J7 a
8 r7 P' l; [1 I9 m" z$ _. `$ F7 B( ?7 V- W$ X
如果你无法流畅访问GitHub导致下载过慢,你可以右键【Download ZIP】复制链接到
9 R5 K2 B+ \/ l, M" J( G# w
, t2 z1 M0 T( chttps://d.serctl.com/
* n2 y& q, v1 Q4 h6 j, H7 h9 P; T1 n; p( O( a/ Y8 A
下载0 f/ I; Y* c# j, a7 {0 \) y( i, l
, X, O  _5 b% E* p+ u' ?
6 ~' p2 j$ ]/ d4 R9 s9 v6 n
把下载完成的压缩包解压到任意目录(路径不能有中文)2 m; [' O: A9 g7 N! S* R" n* I# t

" V5 [! J" C2 S2 F3 B$ Z3 ^. _6 F& s7 L8 _
7 h+ w& T7 C* Z: D# K

  a' z/ w4 \6 S* |6 B1 ~Conda输入:
( e5 c  I# {+ z0 D# S0 _. k9 V6 f
1 H' E0 ^. }6 C, J+ P$ ]! pcd 你解压的DiffSinger仓库的地址' S! G5 d3 Q7 t+ A
! D3 e& o8 d2 y$ T- o
切换到DiffSinger仓库
5 _' }' g/ Q$ D% t( [% G$ X: O& l+ y8 Y: j0 [
% j& Y' {0 x+ r4 _2 G/ X6 J' }: V
这里如果你解压在非C盘路径,可能会出现cd后无变化的情况3 H' T1 C/ z1 H' p

8 B) {4 [8 p, d$ J& m# {) Q- r! c. |0 Q; Y$ c' V
这时你可以输入对应盘符,例如# R2 g+ v) V$ n
( k9 [9 f4 ~7 k2 {" [% |/ D0 u! v5 k, S
f:) `* T- }; h: s- U' ?

+ Y9 T1 ~* d2 S% P回车7 z4 f0 q7 R' [# V

: j+ P) c$ J; u: D7 g% I*请根据自己情况操作6 v& g3 t5 _1 d* |( g4 I8 i$ I
, v4 e/ }! E9 O' [& k
- H: [  s/ @1 @: H
/ O9 h4 r6 D: G
6 K( F( G. J4 y. |! h0 S
然后
) T! m: _. w0 \5 i; O% Z  J, g; C: r7 y
pip install -r requirements.txt -i https://pypi.doubanio.com/simple
9 a& M" e; B, q( a/ D) {
1 {2 G" Y& l4 G+ l& u/ K安装剩余依赖
* w9 c) }3 Q% t8 W- U1 H9 k) y7 h& e
  [$ Y$ G1 X4 k, y5 s5 Q3 j0 m4 Q! x* W+ q6 M1 i
等待下载安装完成
+ a8 {, |3 [! h# H
1 M- u! S+ F% j' f+ s# e8 p4 Q/ D! C( d) }
请确认安装依赖过程中无任何报错(大部分报错可以通过www.baidu.com解决)4 r/ |3 ]/ l2 Y2 h& M" Z
* G9 g% P5 O0 P2 y9 J
1 h6 C+ R1 W4 o& {: A( z

7 s2 g& ~/ r3 H# R; PPart 4.推理
; d* V/ [0 K! I- v*这里以OpenVPI团队2022年12月04日发布的Demo视频的权重为例
9 h/ R1 z, @( k
  O7 n- v  N! z3 C/ Q2 e5 G8 Y1 o5 Q. \- C8 U$ ]
下载交流群(907879266)里的1117_opencpop_ds1000_strict_pinyin.zip* s* p% i3 U3 |

4 o, P* g: i: \: P. F* Z0 ~2 G4 d* a& I: i
解压到你解压的DiffSinger仓库的地址的checkpoints文件夹下
2 |$ F& c; \( i2 ]
( v" g) U8 f3 J2 ^*如无相应能力请勿修改名称等
2 q* K5 ?! N$ S+ P4 X# z9 \7 j! e9 j; O$ `: a0 q; {2 D
*该权重需要搭配最新公测44.1khz声码器& b, u- d* X& O" W! y

( T: ]; |8 E5 I申请地址为
9 @) q8 u7 F" @( K
5 K& g1 A0 [* P. f( Uhttps://openvpi.github.io/vocoders/$ |$ v0 F7 H0 i$ s" g

; s- S. [6 j+ u3 D" m* ?申请成功后同样解压到checkpoints文件夹中8 ~2 m( H$ q8 \! u1 E
6 A$ h. N5 u5 d4 Z$ ~  v. V3 {

! j' I* n- @/ \% v*如果只是为了尝鲜,请使用群内24khz模型权重) r5 P& T, T" r4 r% u
8 `7 a8 k- h# G  N: r4 w2 S' g! F

( z2 R. [; B; Y% x, Z9 @" T下载群文件里的ds文件,出于方便可以放在你解压的DiffSinger仓库的地址根目录
. [" f+ ^2 a2 H& u' Z
4 r1 J  V# h9 A2 ?4 b; ^* \; k
% d4 Z8 ?) T" ^) d" k
6 h, U1 f5 R- e2 l) B. r/ _$ F: @6 n
' h' y9 X% y, B; M然后输入
! N5 r& X" i5 W0 m, R; y# M. v9 y9 a( C8 X3 W0 I. p
python main.py 我多想说再见啊.ds --exp 1117_opencpop_ds1000_strict_pinyin
, c$ {. ~( M5 ~, R% B; g' w  t4 V% Z1 f
*这里--exp用来指定模型权重,后面填你所使用的权重的文件夹名$ {% }' e6 y, Z2 O

9 |$ |: `3 l) G) Z. l4 q1 Y- r$ |. x# y
进度条走完后音频会出现在infer_out文件夹
' n5 o1 d, H( p; Y' O' x
8 O2 b% ~$ U, Z' s9 y
( G7 A3 ]0 f+ ~# t  b2 O0 t. {main.py可以指定以下参数1 R+ d$ P+ o( ?# S' q7 u& q

2 a2 A& Z. w1 ^. E% s5 L
  n* M8 [, `6 C) L: M+ c2 y2 o  -h              展示帮助信息并退出
7 `$ D8 J9 W! _
: J, j! D, V8 D1 W+ i  --exp         指定权重文件夹
9 g+ ]# a# N3 f( ]* V& a
( \3 A. m# T' H( L/ |  --out          指定输出文件夹5 d& i3 q3 `5 G6 j

" l9 h1 k: [( J- ^* M+ }  --title          输出文件名
- D5 x7 g" S9 H  U: w: ^8 H% z( n2 H. u7 ]. @' m7 P& u
  --num        一次运行渲染次数
2 N! S: ?8 c3 a( C$ `/ B1 K- D5 C  L
; s+ ~, M: \- y' e  --key          变调(半音)
+ a' v, q$ f$ v2 c$ t* Y) M6 @" A7 C" Y5 Z5 F! K7 Q
  --seed        指定随机种子
/ ]3 S* N# O4 K* A* U" e" F- ]
3 z5 W# e8 q( D6 q6 v; h1 J  --speedup  PNDM加速倍速(默认10倍,不建议过高)
3 h6 R- p* V8 a5 L
2 X, x+ R6 \; a( y. p6 U+ Y  x$ C  --pitch        指定音高(截止教程编写时已经废弃)* Q. n" R5 k6 f$ Q: o  Y3 r

; e: e" r- K" v  --mel           保存梅尔谱而不是WAV文件9 a0 W# D3 y9 E# q

) p4 R( ^+ o: x% r, z
; V8 W( F0 p- a( T2 l训练部分将在DiffSinger使用教程(暂行版)(随时可能要过期版)(二)中更新
7 j5 \9 k: }+ d# c" w; Y: t& W8 a$ F% O* b4 w5 R- M
因为代码迭代很快,请以最新仓库信息为准% z& a6 w! w, Y

  f+ a, O, m  W0 ^
+ Z- a1 B1 c5 g9 h7 _& \$ `参考文献:《DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism》,第一作者浙江大学刘静林 文献下载地址:https://ojs.aaai.org/index.php/AAAI/article/download/21350/21099 , @, y; D5 U$ P" X+ c0 X

( f8 p2 Y3 }1 w( e. g& d! tDiffSinger原作者的官方仓库:https://github.com/MoonInTheRiver/DiffSinger
0 v) {# Y8 R; [  t! g
- f+ X: [" _+ H* g3 U# [, G; |& xOpenVPI团队的第三方fork仓库:https://github.com/openvpi/DiffSinger
- a) @+ @: t  i
! ^  e- G$ N! u9 s+ {! L2 n@深夜诗人编写的SOVITS和Diff-SVC教程:https://www.yuque.com/jiuwei-nui3d/qng6eg" N/ x# D+ l# @4 ]) d  Q/ y+ e
  M6 e3 J1 f" n5 \: g; \
DiffSinger社区声码器企划:https://openvpi.github.io/vocoders/* _# M% [0 E, y3 o6 P6 W$ Q/ t/ w

! \/ Z5 p: _8 Y6 r3 |+ x: J* K/ QDiffSinger交流群:907879266
' p! V* W: ?1 |8 n
3 ]- K% [9 _4 L: ^/ K: ] 作者:孙飒_TS https://www.bilibili.com/read/cv20356716 出处:bilibili4 D: n5 u, F3 q$ X( Z$ k, E' z) J
% G- |5 t6 c8 E# |5 T& w! I: K3 K
发表于 2023-1-26 10:14:06 | 显示全部楼层
下载到了我需要的文件
发表于 2023-1-26 10:14:20 | 显示全部楼层
气氛不算太好,不过也可以
发表于 2023-1-26 10:14:34 | 显示全部楼层
论坛OK
发表于 2023-1-26 10:14:48 | 显示全部楼层
资料不错
发表于 2023-1-26 10:15:03 | 显示全部楼层
可以解决了我的问题
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

技术交流售后群

QQ|小黑屋|手机版|站点找错-建议|AI手机网 |Sitemap



GMT+8, 2026-4-20 01:18 , Processed in 0.155135 second(s), 27 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表