包含:
语言识别ASR
语义理解ALU
文字转语言TTS
文字识别ocr 等
语音识别(一)——概述 HMM -> GMM -> 深度学习RNN HTK CMU-Sphinx SPTK
语音识别(三)——声源定位、前端处理 语言模型 声学模型, 解码器技术
语音识别(五)——FBank, 语音识别的评价指标, 声学模型进阶, 语言模型进阶, GMM-HMM高斯混合-隐马尔科夫模型
一般译为联结主义时间分类器 ,
适合于输入特征和输出标签之间对齐关系不确定的时间序列问题,
CTC可以自动端到端地同时优化模型参数和对齐切分的边界。
Theano implementation of LSTM and CTC to recognize simple english sentence image