特征工程方法

输入一句话,把每个字拼音标出来,涉及到多音字。
用分类器做预测。两个改进:1. 特征优化、筛选。 2. 训练语料增加数据。
窗口大小是5,前后各一个词。

线性分类,对简单的多音字。作为、为什么。
交叉熵效果不太好,就用SVM。没读多少相关paper。
前后的拼音不重要,词性重要。没有加语义特征?没
句法分析的结构。

其他方法