f*********y 发帖数: 376 | 1 有train set和test set
1。用train set, 利用tune函数去优化 hyper-parameter,10-fold cross
validation,最后给出了保证error最小的parameters。
但是发现这些parameter对test set效果不好,我自己随便试个别的,都更好,假设
kernel都一样。
2。若是有些变量,对所有observation都一样的值,svm会给出warning,说这个变量不
能scale,这会不会影响model。怎么处理?删了这个变量?因为它其实对所有都一样的
值?
3。若是数据量非常大,用R很不给力。 比如我用的数据有15万个observation,每个
observation有200个变量。怎么办?run 很久需要。。。 |
j******4 发帖数: 6090 | 2 1. 我觉得这个结果应该跟你的train set 和 test set的 size有关系。
2. 如果这个变量的variance是0,或者非常接近0,那就不用包括在数据里了吧。
3. 你不能连接到某个cluster上么?R跑循环是非常慢的,可以尝试一下python或者SAS?
个人建议,仅供参考 |
B******5 发帖数: 4676 | 3 3跟R跑循环没关系吧,而且LZ应该是调用的e1071里面的SVM吧,那个都是C level的。
话说Python和SAS怎么搞SVM?
SAS?
【在 j******4 的大作中提到】 : 1. 我觉得这个结果应该跟你的train set 和 test set的 size有关系。 : 2. 如果这个变量的variance是0,或者非常接近0,那就不用包括在数据里了吧。 : 3. 你不能连接到某个cluster上么?R跑循环是非常慢的,可以尝试一下python或者SAS? : 个人建议,仅供参考
|
s*********e 发帖数: 1051 | 4 www.shogun-toolbox.org
【在 B******5 的大作中提到】 : 3跟R跑循环没关系吧,而且LZ应该是调用的e1071里面的SVM吧,那个都是C level的。 : 话说Python和SAS怎么搞SVM? : : SAS?
|
B******5 发帖数: 4676 | 5 看起来很不错唉,没用过,给具体介绍下吧~
【在 s*********e 的大作中提到】 : www.shogun-toolbox.org
|