数据扰动:2000小时音量扰动(+-),2000小时音速扰动(1000拉长或1000缩短 0.1,不能扰动太多,调整语速),

变速:波形叠加,OLA

在时域上扰动,后面再提特征。是简单的拉伸或者拉高吗?不是,重要的是平滑。平滑就差值呗?不是,貌似比较高级。

time scale

A Review of Time-Scale Modification of Music Signals