mirror of
https://github.com/leon-ai/leon.git
synced 2024-10-03 20:57:55 +03:00
fix: whitelist config.json
for the TTS model
This commit is contained in:
parent
faee688924
commit
38a700feb0
1
.gitignore
vendored
1
.gitignore
vendored
@ -34,6 +34,7 @@ core/data/models/*.nlp
|
||||
core/data/models/*.json
|
||||
core/data/models/llm/*
|
||||
core/data/models/audio/tts/**/*.*
|
||||
!core/data/models/audio/tts/config.json
|
||||
core/data/models/audio/asr/**/*.*
|
||||
!core/data/models/**/.gitkeep
|
||||
package.json.backup
|
||||
|
288
core/data/models/audio/tts/config.json
Normal file
288
core/data/models/audio/tts/config.json
Normal file
@ -0,0 +1,288 @@
|
||||
{
|
||||
"train": {
|
||||
"log_interval": 200,
|
||||
"eval_interval": 1000,
|
||||
"seed": 52,
|
||||
"epochs": 10000,
|
||||
"learning_rate": 0.0003,
|
||||
"betas": [0.8, 0.99],
|
||||
"eps": 1e-9,
|
||||
"batch_size": 8,
|
||||
"fp16_run": false,
|
||||
"lr_decay": 0.999875,
|
||||
"segment_size": 16384,
|
||||
"init_lr_ratio": 1,
|
||||
"warmup_epochs": 0,
|
||||
"c_mel": 45,
|
||||
"c_kl": 1.0,
|
||||
"skip_optimizer": true
|
||||
},
|
||||
"data": {
|
||||
"training_files": "/output/V1/model/train.list",
|
||||
"validation_files": "/output/V1/model/val.list",
|
||||
"max_wav_value": 32768.0,
|
||||
"sampling_rate": 44100,
|
||||
"filter_length": 2048,
|
||||
"hop_length": 512,
|
||||
"win_length": 2048,
|
||||
"n_mel_channels": 128,
|
||||
"mel_fmin": 0.0,
|
||||
"mel_fmax": null,
|
||||
"add_blank": true,
|
||||
"n_speakers": 1,
|
||||
"cleaned_text": true,
|
||||
"spk2id": {
|
||||
"EN-Leon-V1_1": 0
|
||||
}
|
||||
},
|
||||
"model": {
|
||||
"use_spk_conditioned_encoder": true,
|
||||
"use_noise_scaled_mas": true,
|
||||
"use_mel_posterior_encoder": false,
|
||||
"use_duration_discriminator": true,
|
||||
"inter_channels": 192,
|
||||
"hidden_channels": 192,
|
||||
"filter_channels": 768,
|
||||
"n_heads": 2,
|
||||
"n_layers": 6,
|
||||
"n_layers_trans_flow": 3,
|
||||
"kernel_size": 3,
|
||||
"p_dropout": 0.1,
|
||||
"resblock": "1",
|
||||
"resblock_kernel_sizes": [3, 7, 11],
|
||||
"resblock_dilation_sizes": [
|
||||
[1, 3, 5],
|
||||
[1, 3, 5],
|
||||
[1, 3, 5]
|
||||
],
|
||||
"upsample_rates": [8, 8, 2, 2, 2],
|
||||
"upsample_initial_channel": 512,
|
||||
"upsample_kernel_sizes": [16, 16, 8, 2, 2],
|
||||
"n_layers_q": 3,
|
||||
"use_spectral_norm": false,
|
||||
"gin_channels": 256
|
||||
},
|
||||
"num_languages": 8,
|
||||
"num_tones": 16,
|
||||
"symbols": [
|
||||
"_",
|
||||
"\"",
|
||||
"(",
|
||||
")",
|
||||
"*",
|
||||
"/",
|
||||
":",
|
||||
"AA",
|
||||
"E",
|
||||
"EE",
|
||||
"En",
|
||||
"N",
|
||||
"OO",
|
||||
"Q",
|
||||
"V",
|
||||
"[",
|
||||
"\\",
|
||||
"]",
|
||||
"^",
|
||||
"a",
|
||||
"a:",
|
||||
"aa",
|
||||
"ae",
|
||||
"ah",
|
||||
"ai",
|
||||
"an",
|
||||
"ang",
|
||||
"ao",
|
||||
"aw",
|
||||
"ay",
|
||||
"b",
|
||||
"by",
|
||||
"c",
|
||||
"ch",
|
||||
"d",
|
||||
"dh",
|
||||
"dy",
|
||||
"e",
|
||||
"e:",
|
||||
"eh",
|
||||
"ei",
|
||||
"en",
|
||||
"eng",
|
||||
"er",
|
||||
"ey",
|
||||
"f",
|
||||
"g",
|
||||
"gy",
|
||||
"h",
|
||||
"hh",
|
||||
"hy",
|
||||
"i",
|
||||
"i0",
|
||||
"i:",
|
||||
"ia",
|
||||
"ian",
|
||||
"iang",
|
||||
"iao",
|
||||
"ie",
|
||||
"ih",
|
||||
"in",
|
||||
"ing",
|
||||
"iong",
|
||||
"ir",
|
||||
"iu",
|
||||
"iy",
|
||||
"j",
|
||||
"jh",
|
||||
"k",
|
||||
"ky",
|
||||
"l",
|
||||
"m",
|
||||
"my",
|
||||
"n",
|
||||
"ng",
|
||||
"ny",
|
||||
"o",
|
||||
"o:",
|
||||
"ong",
|
||||
"ou",
|
||||
"ow",
|
||||
"oy",
|
||||
"p",
|
||||
"py",
|
||||
"q",
|
||||
"r",
|
||||
"ry",
|
||||
"s",
|
||||
"sh",
|
||||
"t",
|
||||
"th",
|
||||
"ts",
|
||||
"ty",
|
||||
"u",
|
||||
"u:",
|
||||
"ua",
|
||||
"uai",
|
||||
"uan",
|
||||
"uang",
|
||||
"uh",
|
||||
"ui",
|
||||
"un",
|
||||
"uo",
|
||||
"uw",
|
||||
"v",
|
||||
"van",
|
||||
"ve",
|
||||
"vn",
|
||||
"w",
|
||||
"x",
|
||||
"y",
|
||||
"z",
|
||||
"zh",
|
||||
"zy",
|
||||
"~",
|
||||
"æ",
|
||||
"ç",
|
||||
"ð",
|
||||
"ø",
|
||||
"ŋ",
|
||||
"œ",
|
||||
"ɐ",
|
||||
"ɑ",
|
||||
"ɒ",
|
||||
"ɔ",
|
||||
"ɕ",
|
||||
"ə",
|
||||
"ɛ",
|
||||
"ɜ",
|
||||
"ɡ",
|
||||
"ɣ",
|
||||
"ɥ",
|
||||
"ɦ",
|
||||
"ɪ",
|
||||
"ɫ",
|
||||
"ɬ",
|
||||
"ɭ",
|
||||
"ɯ",
|
||||
"ɲ",
|
||||
"ɵ",
|
||||
"ɸ",
|
||||
"ɹ",
|
||||
"ɾ",
|
||||
"ʁ",
|
||||
"ʃ",
|
||||
"ʊ",
|
||||
"ʌ",
|
||||
"ʎ",
|
||||
"ʏ",
|
||||
"ʑ",
|
||||
"ʒ",
|
||||
"ʝ",
|
||||
"ʲ",
|
||||
"ˈ",
|
||||
"ˌ",
|
||||
"ː",
|
||||
"̃",
|
||||
"̩",
|
||||
"β",
|
||||
"θ",
|
||||
"ᄀ",
|
||||
"ᄁ",
|
||||
"ᄂ",
|
||||
"ᄃ",
|
||||
"ᄄ",
|
||||
"ᄅ",
|
||||
"ᄆ",
|
||||
"ᄇ",
|
||||
"ᄈ",
|
||||
"ᄉ",
|
||||
"ᄊ",
|
||||
"ᄋ",
|
||||
"ᄌ",
|
||||
"ᄍ",
|
||||
"ᄎ",
|
||||
"ᄏ",
|
||||
"ᄐ",
|
||||
"ᄑ",
|
||||
"ᄒ",
|
||||
"ᅡ",
|
||||
"ᅢ",
|
||||
"ᅣ",
|
||||
"ᅤ",
|
||||
"ᅥ",
|
||||
"ᅦ",
|
||||
"ᅧ",
|
||||
"ᅨ",
|
||||
"ᅩ",
|
||||
"ᅪ",
|
||||
"ᅫ",
|
||||
"ᅬ",
|
||||
"ᅭ",
|
||||
"ᅮ",
|
||||
"ᅯ",
|
||||
"ᅰ",
|
||||
"ᅱ",
|
||||
"ᅲ",
|
||||
"ᅳ",
|
||||
"ᅴ",
|
||||
"ᅵ",
|
||||
"ᆨ",
|
||||
"ᆫ",
|
||||
"ᆮ",
|
||||
"ᆯ",
|
||||
"ᆷ",
|
||||
"ᆸ",
|
||||
"ᆼ",
|
||||
"ㄸ",
|
||||
"!",
|
||||
"?",
|
||||
"…",
|
||||
",",
|
||||
".",
|
||||
"'",
|
||||
"-",
|
||||
"¿",
|
||||
"¡",
|
||||
"SP",
|
||||
"UNK"
|
||||
]
|
||||
}
|
Loading…
Reference in New Issue
Block a user