deep speech를 통해 한국어 E2E(end to end) ASR를 연습하는 프로젝트 입니다.
코드 : https://github.com/SeanNaren/deepspeech.pytorch
논문 링크 : https://arxiv.org/abs/1512.02595
Wiki 부분에 논문을 읽고 간단히 정리했습니다.
링크 : https://github.com/fd873630/deep_speech_2_korean/wiki/Deep-speech-2-%EB%A6%AC%EB%B7%B0-(with-code)
이 프로젝트에서는 AI Hub에서 제공하는 '한국어 음성데이터'를 사용하였습니다. AI Hub 음성 데이터는 다음 링크에서 신청 후 다운로드 하실 수 있습니다.
AI Hub 한국어 음성 데이터 : http://www.aihub.or.kr/aidata/105 ex) KsponSpeech_Filenum.pcm KsponSpeech_Filenum.txt
https://github.com/sooftware/KoSpeech/wiki/Preparation-before-Training
다음을 참조하여 작성하였습니다.
작성에 도움주신 Kim Soohwan께 감사드립니다.
자세한 내용은 wiki에 기술해 놓겠습니다.
해당 작업에 대한 피드백, 문의사항 모두 환영합니다.
[email protected] 로 메일주시면 감사하겠습니다.
인하대학교 전자공학과 4학년 정지호