请教一个 cross-validation 的疑问 - JobHunting版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

JobHunting版 - 请教一个 cross-validation 的疑问

相关主题
● G的电面题，是什么意思啊？	● T problem
● 这种题简直太恶心了！	● 关于java的疑惑
● 请问一道面试题Iterator over nested collections	● [合集] Amazon Onsite 面试题
● 我现在是什么身份？关于“last action rule"	● 我现在是什么身份？关于“last action rule" (转载)
● 请教一个面试题	● 这种情况告诉他们我可以OPT27个月有用么？
● 出乎意外的面试机会	● 也来一道c++的题
● 问几道面试题	● 问一下biospace career fair的入场要求
● 问道题	● programming pearl看不懂这个题

相关话题的讨论汇总
话题: meanacc话题: validation话题: cross话题: acc10话题: acc1

进入JobHunting版参与讨论

1

(共1页)

s*w 发帖数: 729	1 这里专家多，问一下这个我找不到标准答案的问题通常 cross-validation 被用来做 model selection （比如 classifier 里面的某个 parameter), 假码大致如下： random parition data set into train and test for C = 若干候选值 acc1,acc2,...acc10 = do 10-fold cross-validation on train for model(C) meanAcc = mean(acc1,...acc10) if meanAcc > bestAcc bestAcc = meanAcc bestC = C 这个做法是我在 libsvm 里看到的用法。我的问题是 acc1,..acc10 这10个数据 varia nce 也很大啊，直接比 meanAcc 是不是没啥意义(我自己随便找两组出来的20个数，前 10个和后10个的 mean t test 没啥差别啊)；有没有更好的做法？
s***5 发帖数: 2136	2 shuffle data set, and then random sampling. Repeat the CV experiment for 6- 10 times and take the mean of the mean accuracy of each CV.
s*w 发帖数: 729	3 这个是不是就是　nested CV ? 我看文献貌似说 nested CV outer loop 用来　estimate performace, inner loop 用来调参数。所以 nested CV 没解答我的疑问啊：inner　loop cv 里面挑最好的 performance 本身可能没意义啊【在 s***5 的大作中提到】 : shuffle data set, and then random sampling. Repeat the CV experiment for 6- : 10 times and take the mean of the mean accuracy of each CV.

1

(共1页)

进入JobHunting版参与讨论

相关主题
● programming pearl看不懂这个题	● 请教一个面试题
● 报个offer,再问个问题 (转载)	● 出乎意外的面试机会
● one c++ question	● 问几道面试题
● c++ 数组问题	● 问道题
● G的电面题，是什么意思啊？	● T problem
● 这种题简直太恶心了！	● 关于java的疑惑
● 请问一道面试题Iterator over nested collections	● [合集] Amazon Onsite 面试题
● 我现在是什么身份？关于“last action rule"	● 我现在是什么身份？关于“last action rule" (转载)

相关话题的讨论汇总
话题: meanacc话题: validation话题: cross话题: acc10话题: acc1

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)