关于在R中run SVM的问题 - Statistics版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 关于在R中run SVM的问题

相关主题
● 包子求助 2个问题
● [请教] 如何用SAS求解2个parameter满足2个方程
● 陈大师不是民科
● 包子求paper
● Lasso (question on tuning parameter and final model)
● help - parameter and SE estimate with correlated observations
● a parameter estimation problem
● 用EM求的MLE,但是observed likelihood 怎么算呢
● Need Help
● How to use PC SAS to send email via Lotus Notes?

相关话题的讨论汇总
话题: svm话题: 变量话题: set话题: run

进入Statistics版参与讨论

1

(共1页)

f*********y 发帖数: 376	1 有train set和test set 1。用train set，利用tune函数去优化 hyper－parameter，10－fold cross validation，最后给出了保证error最小的parameters。但是发现这些parameter对test set效果不好，我自己随便试个别的，都更好，假设 kernel都一样。 2。若是有些变量，对所有observation都一样的值，svm会给出warning，说这个变量不能scale，这会不会影响model。怎么处理？删了这个变量？因为它其实对所有都一样的值？ 3。若是数据量非常大，用R很不给力。比如我用的数据有15万个observation，每个 observation有200个变量。怎么办？run 很久需要。。。
j******4 发帖数: 6090	2 1. 我觉得这个结果应该跟你的train set 和 test set的 size有关系。 2. 如果这个变量的variance是0，或者非常接近0，那就不用包括在数据里了吧。 3. 你不能连接到某个cluster上么？R跑循环是非常慢的，可以尝试一下python或者SAS？个人建议，仅供参考
B******5 发帖数: 4676	3 3跟R跑循环没关系吧，而且LZ应该是调用的e1071里面的SVM吧，那个都是C level的。话说Python和SAS怎么搞SVM? SAS？【在 j******4 的大作中提到】 : 1. 我觉得这个结果应该跟你的train set 和 test set的 size有关系。 : 2. 如果这个变量的variance是0，或者非常接近0，那就不用包括在数据里了吧。 : 3. 你不能连接到某个cluster上么？R跑循环是非常慢的，可以尝试一下python或者SAS？ : 个人建议，仅供参考
s*********e 发帖数: 1051	4 www.shogun-toolbox.org 【在 B******5 的大作中提到】 : 3跟R跑循环没关系吧，而且LZ应该是调用的e1071里面的SVM吧，那个都是C level的。 : 话说Python和SAS怎么搞SVM? : : SAS？
B******5 发帖数: 4676	5 看起来很不错唉，没用过，给具体介绍下吧～【在 s*********e 的大作中提到】 : www.shogun-toolbox.org

1

(共1页)

进入Statistics版参与讨论

相关主题
● How to use PC SAS to send email via Lotus Notes?
● Question on SAS estimation result
● Looking for a developer for UI of SAS server
● [SAS] multi-thread programming and parameters...
● SAS question - baozi
● 问个低级的SAS问题
● 有没有做association rule的？
● SAS for Windows 7 64-bit
● 请教一个exact logistic regression的问题
● a SAS question (proc report)

相关话题的讨论汇总
话题: svm话题: 变量话题: set话题: run