c*******r 发帖数: 323 | 1 都从哪方面说?最后两问的标准答案是什么?
发信人: windwine (fly), 信区: Statistics
标 题: 今天的capital one statistician面试细节及抱怨,呵呵
关键字: capital one,statistician
发信站: BBS 未名空间站 (Thu Dec 2 16:29:52 2010, 美东)
第3个是role play.分析如何把航空公司晚点的概率降低。给了一个regression的数据
和图表,从correlation matrix看里面有些东西有strong correlation,然后他们直接
去fit regression,然后你自己我去看这个东西有没有问题以及如何用它来指导
business unit,我分析的问题有。1,它把day of the week(mon,tue...)当成
了continuous variable,肯定不行,改成categorical,2。公司只关心delay<8分钟与
否,不care具体时间,所以这个就把regression改为了logistic
regression.3。它把温度作为contiuous variable,其实没有必要,你只要
看是不是温度很差就可以了,所以自己设threhold把温度也变成categorical vraible.
4。起飞地点他没有区分,后面有一个图可以看出不同起飞地方增加地面服务人员影响
不一样,所以可以分开做两个logistic regression model,因为一个是la,一个
是nyc,他们的温度变化会很不一样。5。没有加入飞机上面实际座位的影响,加这个
进入predictor就可以了。6,还有就是他的图表有可能有些数字不合理,比如座位书
=-1,你有空就看一下。然后就照着上面的这些东西自己重新建model就完了。
然后他还顺便问了一下有那个strong correlation你咋办,都是标准答案,然后有补充
了一句如果你一定要把拿两个factor都放在Model里面你该如何搞和如何解释,都
可以从书上找到答案的,就不贴出来给大家一点悬念了。 |
|