kaldi简介

kaldi

  • 学习thchs30的脚本:https://github.com/kaldi-asr/kaldi/tree/master/egs/thchs30/s5 中文语音识别

  • 学习kaldi的话,先从hmm-gmm入手比较好,

    • steps/train_delta.sh build-tree命令那部分的代码对应htk book第十章tree-based clustering, gmm-est命令那部分的代码对应htk book第八章的Parameter Re-Estimation Formulae;
  • steps/train_fmllr.sh, steps/decode.sh这些脚本都是基于hmm-gmm模型。
  • 神经网络
    • nnet1 hmm-dnn架构,相关的知识可以查阅微软俞栋2009-2013期间发表的论文
    • nnet2 同样是hmm-dnn架构,但是使用的是dan povey团队设计的NSGD算法,支持多线程并行训练,学习nnet2可以追dan povey从2012年之后的论文
    • nnet3 chain model,以及其他的神经网路结构(rn,cnn,lstm)的学习

扩展阅读