MFCC(Mel频率倒谱系数)对应的物理含义是什么?
https://www.zhihu.com/question/21302276

FAQ

用深度学习进行语音识别为什么还要算mfcc?

  • 特征提取本身,是一种数据降维手段,可以有效的降低后续模式识别系统的复杂度/运算量。
  • 深度学习确实可以自动提取特征,可以直接用pcm码进行训练,但这样会面临一些问题,如维度太高
  • 维度高,一方面计算量大,一方面模型也更大,容易过拟合

语音识别业界也一致在尝试使用深度学习从原始音频当中提取特征去替代mfcc和mel fbank。

参考:https://www.zhihu.com/question/67487899