참고
[실습] E-branchformer, Conformer ASR 훈련 비교
최대 1 분 소요
포스트 준비 중
[paper] E-BRANCHFORMER: BRANCHFORMER WITH ENHANCED MERGING FOR SPEECH RECOGNITION
2 분 소요
E-Branchformer[Kim22]는 음성인식 분야 SOTA모델 Conformer와 견주어 비교되는 모델이다.
[실습] VITS 모델(TTS) 중국어 데이터 훈련 및 평가 실습
2 분 소요
이번에는 VITS 모델(TTS)을 중국어 데이터로 훈련한 과정을 기록한 포스트이다.
[paper] Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
1 분 소요
VITS는 One-stage TTS 중에서 준수한 natural sounding audio를 생성하는 모델이다.