Spaces:

alexandrainst
/

TTS-base

Sleeping

Biorrith commited on Sep 22

Commit

191fc47

1 Parent(s): 3e92db8

Changes to handle device properly

Files changed (2) hide show

app.py CHANGED Viewed

@@ -178,7 +178,7 @@ with gr.Blocks() as demo:
     gr.Markdown(get_supported_languages_display())
     with gr.Row():
         with gr.Column():
-            initial_lang = "fr"
             text = gr.Textbox(
                 value=default_text_for_ui(initial_lang),
                 label="Text to synthesize (max chars 300)",

     gr.Markdown(get_supported_languages_display())
     with gr.Row():
         with gr.Column():
+            initial_lang = "da"
             text = gr.Textbox(
                 value=default_text_for_ui(initial_lang),
                 label="Text to synthesize (max chars 300)",

src/chatterbox/mtl_tts.py CHANGED Viewed

@@ -142,12 +142,12 @@ class ChatterboxMultilingualTTS:
         ve = VoiceEncoder()
         ve.load_state_dict(
-            torch.load(ckpt_dir / "ve.pt", weights_only=True)
         )
         ve.to(device).eval()
         t3 = T3(T3Config.multilingual())
-        t3_state = load_safetensors(ckpt_dir / "t3_23lang.safetensors")
         if "model" in t3_state.keys():
             t3_state = t3_state["model"][0]
         t3.load_state_dict(t3_state)
@@ -155,7 +155,7 @@ class ChatterboxMultilingualTTS:
         s3gen = S3Gen()
         s3gen.load_state_dict(
-            torch.load(ckpt_dir / "s3gen.pt", weights_only=True)
         )
         s3gen.to(device).eval()
@@ -165,7 +165,7 @@ class ChatterboxMultilingualTTS:
         conds = None
         if (builtin_voice := ckpt_dir / "conds.pt").exists():
-            conds = Conditionals.load(builtin_voice).to(device)
         return cls(t3, s3gen, ve, tokenizer, device, conds=conds)

         ve = VoiceEncoder()
         ve.load_state_dict(
+            torch.load(ckpt_dir / "ve.pt", weights_only=True, map_location=device)
         )
         ve.to(device).eval()
         t3 = T3(T3Config.multilingual())
+        t3_state = load_safetensors(ckpt_dir / "t3_23lang.safetensors", device=str(device))
         if "model" in t3_state.keys():
             t3_state = t3_state["model"][0]
         t3.load_state_dict(t3_state)
         s3gen = S3Gen()
         s3gen.load_state_dict(
+            torch.load(ckpt_dir / "s3gen.pt", weights_only=True, map_location=device)
         )
         s3gen.to(device).eval()
         conds = None
         if (builtin_voice := ckpt_dir / "conds.pt").exists():
+            conds = Conditionals.load(builtin_voice, map_location=device).to(device)
         return cls(t3, s3gen, ve, tokenizer, device, conds=conds)