今天早上起来寻思着是不是还可以对SVM的准确率再挖掘下,
就上libsvm的网站看了看, 本来是想了解下各个参数的意义和各种kernel function的区别的.
正好看到这篇libsvm作者写的: A practical guide to SVM classification
写得很不错, 看了以后就发现文章把我使用中的N个错误都指出来了 (一皿一).
简单来说, 还需要改进的地方就是:
1. 对data-set进行scale的时候, 要保存训练集的scale数据, 以对test set进行等比例的缩放.
2. 通过一个grid-search找到最优的C和gamma值组合.
看来我得把我的程序重新大动手术一番,
凄惨的是还得加上一个grid-search的程序段.
为了尽快出结果, 我还是直接偷懒用工具包好了, 否则改代码会严重拖后腿滴.