由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 面试问题求教(更新了啊)
相关主题
问一个Model的问题问题:fitness in categorical regression
ANOVA model 中 CELL count 过小到底对model有什么影响[合集] 纺锤型的残差图代表什么意思?
请高手帮我看看:glimmix model 有更好的 建议吗?logistic, overfit了怎么办?
弱问个用R fit GLM的问题陈大师, 我很好奇
R-square of logistic regression弱问个categorical variable有关的问题
急问negative binomial regression的结果的model significance看哪个参数为啥做了segmentation后模型fit更差?
Maximum Likelihood estimationR 如何自动保存结果到PDF里面?
新人问个matlab统计方面的问题用REML fit mixed model, 出现negative estimate of error variance component,
相关话题的讨论汇总
话题: model话题: variance话题: var话题: cv话题: minimize
进入Statistics版参与讨论
1 (共1页)
b****w
发帖数: 71
1
多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。
面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone
interview啊。下面是两道新鲜出炉的面试题,请教大家
1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize
variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不
知道是如何结合。而且我觉得应该是要用到error iid这个条件
2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求
安慰了
具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(
20-n)=0.12,求n.那个(20,n)就是20 choose n,我不知道怎么答。这个应该也不是查表,是不是有什么近似求解的方法?但是N才20,也太小了点吧。。
希望大家积极讨论,也希望对大家有所帮助
突然又想到一个问题,一起问了。建好一个Model以后如何判断这个Model已经OK了?除了看R^2,Deviance,AIC什么的以外还有什么准则么?
y*******u
发帖数: 930
2
弱问第一题的目标是啥?
如果光是min var的话
显然B的权重为0啊

minimize

【在 b****w 的大作中提到】
: 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。
: 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone
: interview啊。下面是两道新鲜出炉的面试题,请教大家
: 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
: 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize
: variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不
: 知道是如何结合。而且我觉得应该是要用到error iid这个条件
: 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求
: 安慰了
: 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(

n**m
发帖数: 156
3
第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几
给出来,你的答案显然没有充分利用他的条件。
第二部哦,不知道你想说啥。
第三个,一个需要做的是检查estimated error的distribution.

minimize

【在 b****w 的大作中提到】
: 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。
: 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone
: interview啊。下面是两道新鲜出炉的面试题,请教大家
: 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
: 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize
: variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不
: 知道是如何结合。而且我觉得应该是要用到error iid这个条件
: 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求
: 安慰了
: 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(

y*******u
发帖数: 930
4
最后一个还要看有没有influencial point 等等diagnosis

第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几
给出来,你的答案显然没有充分利用他的条件。
第二部哦,不知道你想说啥。
第三个,一个需要做的是检查estimated error的distribution.
minimize

【在 n**m 的大作中提到】
: 第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几
: 给出来,你的答案显然没有充分利用他的条件。
: 第二部哦,不知道你想说啥。
: 第三个,一个需要做的是检查estimated error的distribution.
:
: minimize

n**m
发帖数: 156
5
不是0,variance的weight是wa^2,不是wa,所以不能光挑小的,算了一下,不考虑别
的,a的weight是Va/Va+Vb

【在 y*******u 的大作中提到】
: 弱问第一题的目标是啥?
: 如果光是min var的话
: 显然B的权重为0啊
:
: minimize

y*******u
发帖数: 930
6
我还是没看懂么
这个跟variance的权重的平方有什么关系
我觉得题目起码要多一个限定条件跟outcome有关系才能求具体的min variance
如果光是单独min variance 不是
min(25+wb^2*49)
wb=0么?

【在 n**m 的大作中提到】
: 不是0,variance的weight是wa^2,不是wa,所以不能光挑小的,算了一下,不考虑别
: 的,a的weight是Va/Va+Vb

n**m
发帖数: 156
7
不好意思,第一题没看仔细,原来说的是两个model。同等回答。

【在 n**m 的大作中提到】
: 第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几
: 给出来,你的答案显然没有充分利用他的条件。
: 第二部哦,不知道你想说啥。
: 第三个,一个需要做的是检查estimated error的distribution.
:
: minimize

y*******u
发帖数: 930
8
我不知道lz的interview具体是啥。。
但我猜测答案应该就是0
A model Expectation 大 variance小
B model Expectation 小 variance大
无论给定什么的产出条件
A都完胜。。

不好意思,第一题没看仔细,原来说的是两个model。你两边的数据都是一样的吗?

【在 n**m 的大作中提到】
: 不好意思,第一题没看仔细,原来说的是两个model。同等回答。
m*********n
发帖数: 413
9
1. sample size must be a factor.
2. 查表?
3. test of goodness-of-fit, and using validation data set to avoid overfit.

minimize

【在 b****w 的大作中提到】
: 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。
: 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone
: interview啊。下面是两道新鲜出炉的面试题,请教大家
: 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
: 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize
: variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不
: 知道是如何结合。而且我觉得应该是要用到error iid这个条件
: 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求
: 安慰了
: 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(

n**m
发帖数: 156
10
如果只是model的话,是不是假定是一样的数据,至少dependent是一样的吧

【在 m*********n 的大作中提到】
: 1. sample size must be a factor.
: 2. 查表?
: 3. test of goodness-of-fit, and using validation data set to avoid overfit.
:
: minimize

相关主题
急问negative binomial regression的结果的model significance看哪个参数问题:fitness in categorical regression
Maximum Likelihood estimation[合集] 纺锤型的残差图代表什么意思?
新人问个matlab统计方面的问题logistic, overfit了怎么办?
进入Statistics版参与讨论
A*******s
发帖数: 3942
11
dont understand question 1... i think the goal should be minimizing the
error instead of variance. a constant predicted value always has zero
variance with very high bias.
m*********n
发帖数: 413
12
是哦。
这题不会是这样子的吧
Y_outcome1 = ...
Y_outcome2 = ...
var(Y_outcome1) = ...
var(Y_outcome2) = ...
need (w1,w2) = argmin(var(w1*Y_outcome1+w2*Y_outcome2)) given w1+w2=1
这不就是选其中一个model嘛。。

【在 n**m 的大作中提到】
: 如果只是model的话,是不是假定是一样的数据,至少dependent是一样的吧
j*******r
发帖数: 32
13
谈谈我的看法~~~
第一个问题应该跟CAMP模型一样,给定mean和variance,求个有效边界,答案应该是半
个椭圆。
第二个二项分布的概率可以用泊松来逼近,不过用计算机直接算也行,不可能让你当场
猜吧。
第三个要看什么模型吧,简单的回归诊断简单点的是QQ图,找异常点,影响值大的点,
最重要的是残差分析,画出残差对于自变量和时间等的图,看看有什么趋势。判别分析
的话主要考虑误差率,分样本内误差和样本外误差,以及CV等。

样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
minimize

【在 b****w 的大作中提到】
: 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。
: 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone
: interview啊。下面是两道新鲜出炉的面试题,请教大家
: 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
: 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize
: variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不
: 知道是如何结合。而且我觉得应该是要用到error iid这个条件
: 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求
: 安慰了
: 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(

n**m
发帖数: 156
14
第一个问题是不是把model a和b里的independent variable都放进一个model里
比如a是 y=x1 + x2
b是 y=x1+ x3
然后新的model 就是 y= x1+ x2 + x3
y*******u
发帖数: 930
15

请问CV是啥呀?

【在 j*******r 的大作中提到】
: 谈谈我的看法~~~
: 第一个问题应该跟CAMP模型一样,给定mean和variance,求个有效边界,答案应该是半
: 个椭圆。
: 第二个二项分布的概率可以用泊松来逼近,不过用计算机直接算也行,不可能让你当场
: 猜吧。
: 第三个要看什么模型吧,简单的回归诊断简单点的是QQ图,找异常点,影响值大的点,
: 最重要的是残差分析,画出残差对于自变量和时间等的图,看看有什么趋势。判别分析
: 的话主要考虑误差率,分样本内误差和样本外误差,以及CV等。
:
: 样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且

y*******u
发帖数: 930
16
我觉得有点像add-variable analysis
最大可能应该是所有的IV都是不相干的
b model作为base model 加入a model的IV
这个样子
不知道对不对。。

第一个问题是不是把model a和b里的independent variable都放进一个model里
比如a是 y=x1 + x2
b是 y=x1+ x3
然后新的model 就是 y= x1+ x2 + x3

【在 n**m 的大作中提到】
: 第一个问题是不是把model a和b里的independent variable都放进一个model里
: 比如a是 y=x1 + x2
: b是 y=x1+ x3
: 然后新的model 就是 y= x1+ x2 + x3

1 (共1页)
进入Statistics版参与讨论
相关主题
用REML fit mixed model, 出现negative estimate of error variance component,R-square of logistic regression
问两个个KNN的问题急问negative binomial regression的结果的model significance看哪个参数
怎样比较hierarchical modelMaximum Likelihood estimation
state farm phone interview新人问个matlab统计方面的问题
问一个Model的问题问题:fitness in categorical regression
ANOVA model 中 CELL count 过小到底对model有什么影响[合集] 纺锤型的残差图代表什么意思?
请高手帮我看看:glimmix model 有更好的 建议吗?logistic, overfit了怎么办?
弱问个用R fit GLM的问题陈大师, 我很好奇
相关话题的讨论汇总
话题: model话题: variance话题: var话题: cv话题: minimize