由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 请教一个 cross-validation 的疑问
相关主题
G的电面题,是什么意思啊?T problem
这种题简直太恶心了!关于java的疑惑
请问一道面试题Iterator over nested collections[合集] Amazon Onsite 面试题
我现在是什么身份?关于“last action rule"我现在是什么身份?关于“last action rule" (转载)
请教一个面试题这种情况告诉他们我可以OPT27个月有用么?
出乎意外的面试机会也来一道c++的题
问几道面试题问一下biospace career fair的入场要求
问道题programming pearl看不懂这个题
相关话题的讨论汇总
话题: meanacc话题: validation话题: cross话题: acc10话题: acc1
进入JobHunting版参与讨论
1 (共1页)
s*w
发帖数: 729
1
这里专家多,问一下这个我找不到标准答案的问题
通常 cross-validation 被用来做 model selection (比如 classifier 里面的某个
parameter), 假码大致如下:
random parition data set into train and test
for C = 若干候选值
acc1,acc2,...acc10 = do 10-fold cross-validation on train for model(C)
meanAcc = mean(acc1,...acc10)
if meanAcc > bestAcc
bestAcc = meanAcc
bestC = C
这个做法是我在 libsvm 里看到的用法。我的问题是 acc1,..acc10 这10个数据 varia
nce 也很大啊,直接比 meanAcc 是不是没啥意义(我自己随便找两组出来的20个数,前
10个和后10个的 mean t test 没啥差别啊);有没有更好的做法?
s***5
发帖数: 2136
2
shuffle data set, and then random sampling. Repeat the CV experiment for 6-
10 times and take the mean of the mean accuracy of each CV.
s*w
发帖数: 729
3
这个是不是就是 nested CV ?
我看文献貌似说 nested CV outer loop 用来 estimate performace, inner loop 用
来调参数。所以 nested CV 没解答我的疑问啊:inner loop cv 里面挑最好的
performance 本身可能没意义啊

【在 s***5 的大作中提到】
: shuffle data set, and then random sampling. Repeat the CV experiment for 6-
: 10 times and take the mean of the mean accuracy of each CV.

1 (共1页)
进入JobHunting版参与讨论
相关主题
programming pearl看不懂这个题请教一个面试题
报个offer,再问个问题 (转载)出乎意外的面试机会
one c++ question问几道面试题
c++ 数组问题问道题
G的电面题,是什么意思啊?T problem
这种题简直太恶心了!关于java的疑惑
请问一道面试题Iterator over nested collections[合集] Amazon Onsite 面试题
我现在是什么身份?关于“last action rule"我现在是什么身份?关于“last action rule" (转载)
相关话题的讨论汇总
话题: meanacc话题: validation话题: cross话题: acc10话题: acc1