TTS Audio Suite
TTS Audio Suite là bộ node ComfyUI cho text-to-speech, voice conversion, phụ đề SRT và xử lý audio, giúp creator thử nhiều engine giọng nói trong cùng một workspace local.
https://github.com/diodiogod/TTS-Audio-Suite ↗⭐ 1.073 sao 🍴 124 fork ~325 ngày tuổi, ~3.3 sao/ngày
TTS Audio Suite dùng để làm gì?
- ✓ Tạo voice-over nháp cho video ngắn bằng nhiều engine TTS khác nhau mà không rời khỏi ComfyUI.
- ✓ Canh lại phụ đề SRT sau khi sửa transcript để video thuyết minh đỡ lệch nhịp.
- ✓ Thử voice conversion hoặc clone giọng cho dự án nội bộ có quyền sử dụng giọng rõ ràng.
- ✓ Ghép audio AI vào workflow ảnh/video ComfyUI sẵn có của studio thay vì xử lý âm thanh ở một app riêng.
TTS Audio Suite có gì nổi bật?
- •Tích hợp nhiều engine TTS và voice conversion như RVC, Echo-TTS, Qwen3-TTS, CozyVoice 3, IndexTTS-2, ChatterBox, F5-TTS, Higgs Audio và VibeVoice.
- •README nhấn mạnh subtitle workflow: transcribe SRT, rebuild subtitle từ transcript đã chỉnh và ước lượng timing từ plain text.
- •Có node cho text-to-speech đa ngôn ngữ, voice cloning/voice conversion, audio editing và một số luồng training RVC.
- •Thiết kế theo môi trường ComfyUI, hợp với người đã dùng node-based workflow cho ảnh/video AI.
TTS Audio Suite thay được gì, tiết kiệm gì?
Khâu chuyển qua lại giữa app TTS, tool phụ đề, phần mềm chỉnh audio và ComfyUI khi làm voice-over cho video.
Tiết kiệm: Có thể giảm nhiều thao tác xuất nhập file khi team đã dùng ComfyUI, nhưng vẫn cần thời gian chọn engine và kiểm chất lượng giọng cho từng ngôn ngữ.
Có thể thay: Một phần thao tác ở ElevenLabs, CapCut voice, tool phụ đề và app chỉnh audio khi làm bản nháp
TTS Audio Suite hợp với ai ở Việt Nam?
Creator Việt làm video ngắn, khoá học, review sản phẩm hoặc clip faceless thường cần voice-over nhanh, phụ đề đúng nhịp và nhiều giọng thử, nhưng các tool rời rạc khiến vòng sửa âm thanh bị đứt đoạn.
Vì sao đáng chú ý: Từ khoá lồng tiếng AI, chuyển văn bản thành giọng nói, clone giọng AI, tạo phụ đề tự động và ComfyUI tiếng Việt đã có nhu cầu rõ; TTS Audio Suite có thể chen vào nhóm người đã quen ComfyUI.
⚠ Cần lưu ý gì trước khi dùng TTS Audio Suite?
Rủi ro lớn là chất lượng tiếng Việt và quyền sử dụng giọng. Một số engine cần model lớn, GPU, dependency riêng; voice cloning/voice conversion cũng cần dùng với giọng có quyền rõ ràng để tránh rủi ro đạo đức và pháp lý.
Công cụ liên quan
-
Pixelle-Video
Pixelle-Video là công cụ tạo video ngắn tự động: bạn nhập một chủ đề, hệ thống tự viết kịch bản, tạo hình/clip AI, đọc voice, thêm nhạc nền rồi ghép thành video hoàn chỉnh.
-
HunyuanVideo-Foley
HunyuanVideo-Foley tạo hiệu ứng âm thanh đồng bộ với video, giúp editor thử Foley audio cho clip, phim ngắn, quảng cáo hoặc game mà không phải tự dựng từng tiếng động từ đầu.
-
Toonflow
Toonflow là app desktop AI giúp biến truyện, tiểu thuyết hoặc kịch bản thành phim hoạt hình ngắn bằng các bước viết lại, chia cảnh, tạo nhân vật và sinh video.
-
Ian Xiaohei Illustrations
Ian Xiaohei Illustrations là skill cho Codex giúp bạn biến bài viết và nội dung kiến thức thành bộ hình minh họa 16:9 nét tay trắng nền, thay vì chèn stock ảnh hoặc infographic nặng mùi slide.
Member insight
Dùng thử TTS Audio Suite theo từng bước
Bản public giúp bạn biết tool này có đáng mở tab không. Phần thành viên đi sâu hơn: nên thử hay theo dõi, chuẩn bị gì, làm từng bước thế nào để có output đầu tiên, và bẫy nào dễ làm mất thời gian.
- Practitioner guide: 5 bước thử nhanh, kèm chuẩn bị và kết quả kỳ vọng.
- Decision note: Nên thử ngay, theo dõi thêm, hay bỏ qua để khỏi mất công test sai lúc.
- Risk notes: Cạm bẫy triển khai, điều kiện kỹ thuật và lỗi dễ gặp khi thử.
- Nguồn kiểm chứng: 1 link cộng đồng/quốc tế để tự đánh giá trước khi đưa vào workflow.
- Bonus khuếch đại: Có góc nội dung cho creator/đội content nếu cần kéo người trong ngành về case này.