b****w 发帖数: 71 | 1 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。
面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone
interview啊。下面是两道新鲜出炉的面试题,请教大家
1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize
variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不
知道是如何结合。而且我觉得应该是要用到error iid这个条件
2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求
安慰了
具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(
20-n)=0.12,求n.那个(20,n)就是20 choose n,我不知道怎么答。这个应该也不是查表,是不是有什么近似求解的方法?但是N才20,也太小了点吧。。
希望大家积极讨论,也希望对大家有所帮助
突然又想到一个问题,一起问了。建好一个Model以后如何判断这个Model已经OK了?除了看R^2,Deviance,AIC什么的以外还有什么准则么? | y*******u 发帖数: 930 | 2 弱问第一题的目标是啥?
如果光是min var的话
显然B的权重为0啊
minimize
【在 b****w 的大作中提到】 : 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。 : 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone : interview啊。下面是两道新鲜出炉的面试题,请教大家 : 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且 : 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize : variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不 : 知道是如何结合。而且我觉得应该是要用到error iid这个条件 : 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求 : 安慰了 : 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(
| n**m 发帖数: 156 | 3 第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几
给出来,你的答案显然没有充分利用他的条件。
第二部哦,不知道你想说啥。
第三个,一个需要做的是检查estimated error的distribution.
minimize
【在 b****w 的大作中提到】 : 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。 : 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone : interview啊。下面是两道新鲜出炉的面试题,请教大家 : 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且 : 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize : variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不 : 知道是如何结合。而且我觉得应该是要用到error iid这个条件 : 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求 : 安慰了 : 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(
| y*******u 发帖数: 930 | 4 最后一个还要看有没有influencial point 等等diagnosis
第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几
给出来,你的答案显然没有充分利用他的条件。
第二部哦,不知道你想说啥。
第三个,一个需要做的是检查estimated error的distribution.
minimize
【在 n**m 的大作中提到】 : 第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几 : 给出来,你的答案显然没有充分利用他的条件。 : 第二部哦,不知道你想说啥。 : 第三个,一个需要做的是检查estimated error的distribution. : : minimize
| n**m 发帖数: 156 | 5 不是0,variance的weight是wa^2,不是wa,所以不能光挑小的,算了一下,不考虑别
的,a的weight是Va/Va+Vb
【在 y*******u 的大作中提到】 : 弱问第一题的目标是啥? : 如果光是min var的话 : 显然B的权重为0啊 : : minimize
| y*******u 发帖数: 930 | 6 我还是没看懂么
这个跟variance的权重的平方有什么关系
我觉得题目起码要多一个限定条件跟outcome有关系才能求具体的min variance
如果光是单独min variance 不是
min(25+wb^2*49)
wb=0么?
【在 n**m 的大作中提到】 : 不是0,variance的weight是wa^2,不是wa,所以不能光挑小的,算了一下,不考虑别 : 的,a的weight是Va/Va+Vb
| n**m 发帖数: 156 | 7 不好意思,第一题没看仔细,原来说的是两个model。同等回答。
【在 n**m 的大作中提到】 : 第一个,你说的没错啊,不过他既然已经给了iid,我想他是不是预期你能把答案这几 : 给出来,你的答案显然没有充分利用他的条件。 : 第二部哦,不知道你想说啥。 : 第三个,一个需要做的是检查estimated error的distribution. : : minimize
| y*******u 发帖数: 930 | 8 我不知道lz的interview具体是啥。。
但我猜测答案应该就是0
A model Expectation 大 variance小
B model Expectation 小 variance大
无论给定什么的产出条件
A都完胜。。
不好意思,第一题没看仔细,原来说的是两个model。你两边的数据都是一样的吗?
【在 n**m 的大作中提到】 : 不好意思,第一题没看仔细,原来说的是两个model。同等回答。
| m*********n 发帖数: 413 | 9 1. sample size must be a factor.
2. 查表?
3. test of goodness-of-fit, and using validation data set to avoid overfit.
minimize
【在 b****w 的大作中提到】 : 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。 : 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone : interview啊。下面是两道新鲜出炉的面试题,请教大家 : 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且 : 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize : variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不 : 知道是如何结合。而且我觉得应该是要用到error iid这个条件 : 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求 : 安慰了 : 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(
| n**m 发帖数: 156 | 10 如果只是model的话,是不是假定是一样的数据,至少dependent是一样的吧
【在 m*********n 的大作中提到】 : 1. sample size must be a factor. : 2. 查表? : 3. test of goodness-of-fit, and using validation data set to avoid overfit. : : minimize
| | | A*******s 发帖数: 3942 | 11 dont understand question 1... i think the goal should be minimizing the
error instead of variance. a constant predicted value always has zero
variance with very high bias. | m*********n 发帖数: 413 | 12 是哦。
这题不会是这样子的吧
Y_outcome1 = ...
Y_outcome2 = ...
var(Y_outcome1) = ...
var(Y_outcome2) = ...
need (w1,w2) = argmin(var(w1*Y_outcome1+w2*Y_outcome2)) given w1+w2=1
这不就是选其中一个model嘛。。
【在 n**m 的大作中提到】 : 如果只是model的话,是不是假定是一样的数据,至少dependent是一样的吧
| j*******r 发帖数: 32 | 13 谈谈我的看法~~~
第一个问题应该跟CAMP模型一样,给定mean和variance,求个有效边界,答案应该是半
个椭圆。
第二个二项分布的概率可以用泊松来逼近,不过用计算机直接算也行,不可能让你当场
猜吧。
第三个要看什么模型吧,简单的回归诊断简单点的是QQ图,找异常点,影响值大的点,
最重要的是残差分析,画出残差对于自变量和时间等的图,看看有什么趋势。判别分析
的话主要考虑误差率,分样本内误差和样本外误差,以及CV等。
样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
minimize
【在 b****w 的大作中提到】 : 多谢大家回帖,我针对我之前没有说清楚的地方进行了一点补充。 : 面试官很Nice,一步步引导我啊,可惜我还是不知道如何解。。又悲剧了一个phone : interview啊。下面是两道新鲜出炉的面试题,请教大家 : 1.针对同一个data set,现有两个model A,B,可能是用不同的方法做出来的,DV是一样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且 : 两个Model的error都是iid的,先要把两个model结合起来,赋不同的weight, minimize : variance.怎么弄?我当时说是不是就是求Min var(w1*A+w2*B),他说不是。我真不 : 知道是如何结合。而且我觉得应该是要用到error iid这个条件 : 2.这个简单点,但当时我已经秀逗了,完全转不了脑子了,嗨。。只能怪经验太少以求 : 安慰了 : 具体我就不说了,反正我得到最后的一步就是binominal, (20,n)*(0.15)^n*(0.85)^(
| n**m 发帖数: 156 | 14 第一个问题是不是把model a和b里的independent variable都放进一个model里
比如a是 y=x1 + x2
b是 y=x1+ x3
然后新的model 就是 y= x1+ x2 + x3 | y*******u 发帖数: 930 | 15
请问CV是啥呀?
【在 j*******r 的大作中提到】 : 谈谈我的看法~~~ : 第一个问题应该跟CAMP模型一样,给定mean和variance,求个有效边界,答案应该是半 : 个椭圆。 : 第二个二项分布的概率可以用泊松来逼近,不过用计算机直接算也行,不可能让你当场 : 猜吧。 : 第三个要看什么模型吧,简单的回归诊断简单点的是QQ图,找异常点,影响值大的点, : 最重要的是残差分析,画出残差对于自变量和时间等的图,看看有什么趋势。判别分析 : 的话主要考虑误差率,分样本内误差和样本外误差,以及CV等。 : : 样的,IV没说。 已知outcome(A)=100,outcome(B)=80, var(A)=25,var(B)=49,并且
| y*******u 发帖数: 930 | 16 我觉得有点像add-variable analysis
最大可能应该是所有的IV都是不相干的
b model作为base model 加入a model的IV
这个样子
不知道对不对。。
第一个问题是不是把model a和b里的independent variable都放进一个model里
比如a是 y=x1 + x2
b是 y=x1+ x3
然后新的model 就是 y= x1+ x2 + x3
【在 n**m 的大作中提到】 : 第一个问题是不是把model a和b里的independent variable都放进一个model里 : 比如a是 y=x1 + x2 : b是 y=x1+ x3 : 然后新的model 就是 y= x1+ x2 + x3
|
|