Name		Name	Last commit message	Last commit date
parent directory ..
readme.md		readme.md

readme.md

Speech Automatic Speech Recognition,(ASR)

包含：

    语言识别ASR 
    语义理解ALU 
    文字转语言TTS  
    文字识别ocr 等

语言识别ASR

语音识别（一）——概述 HMM -> GMM -> 深度学习RNN HTK CMU-Sphinx SPTK

语音识别（二）——基本框架, Microphone Array, 声源定位信号处理和特征提取 MFCC、声学模型(gmm-hmm)、语言模型（Language Model, LM）和解码器(Decoder)()

语音识别（三）——声源定位、前端处理语言模型声学模型, 解码器技术

语音识别（四）——声音分割，DTW(时域,Dynamic Time Warping动态时间规整算法), Spectrogram(频域,FFT傅里叶变换，声谱图), Cepstrum Analysis, Mel-Frequency Analysis

语音识别（五）——FBank, 语音识别的评价指标, 声学模型进阶, 语言模型进阶, GMM-HMM高斯混合-隐马尔科夫模型

CTC(Connectionist Temporal Classifier)

一般译为联结主义时间分类器 ，
适合于输入特征和输出标签之间对齐关系不确定的时间序列问题，
CTC可以自动端到端地同时优化模型参数和对齐切分的边界。

LSTM-CTC 博客详解

Theano implementation of LSTM and CTC to recognize simple english sentence image

语义理解ALU

文字转语音TTS

文字识别ocr 其实属于图像识别问题了