Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다. #8

Open
yangwook opened this issue Jul 21, 2019 · 5 comments

Comments

@yangwook
Copy link

yangwook commented Jul 21, 2019

tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다.
test wave 음성이 train png 파일 문구가 나오는데 이건 원래 그런 건가요? 아니면 세팅해주어야 하는 건가요?
pip freeze 환경 공유 가능할까요?

@yangwook yangwook changed the title synthesize error 문의 tacotron2 synthesize error 문의 Jul 21, 2019
@yangwook yangwook changed the title tacotron2 synthesize error 문의 tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다. Jul 21, 2019
@yangwook
Copy link
Author

git downlaod 받아 그 상태에서 python train_tacotron2.py 실행하였습니다. train시 텍스트와 wave 파일이 다르게 학습되는 걸로 보이는데 이런 경우 원인을 알기 어렵네요? 참고할 만한 사항 있을까요?

@yangwook
Copy link
Author

yangwook commented Aug 9, 2019

음성합성 학습이 제대로 동작 되는지요?

@hccho2
Copy link
Owner

hccho2 commented Sep 17, 2019

train용 input data를 만들 때, audio와 text의 sync가 잘 맞지 않은 것 같습니다.
data를 다시 살펴보셔야 할 것 같습니다.

@great-energizer
Copy link

image

학습시 test의 결과(png, wav)와 train의 결과(png, wav) 파일이 각각 만들어 지고, 다른 텍스트로 각기 만들어지는데...
혹시 Train, test결과의 png와 wav 파일과 png 파일을 서로 섞어서 확인한건 아닌지요...?

@hccho2
Copy link
Owner

hccho2 commented Aug 24, 2020

train은 teacher forcing 방식으로 음성을 생성합니다. test에는 teacher forcing 방식이 사용될 수 없기 때문에 각각 생성하고 있습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants