由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 今天早上google 统计面试的几个问题,新鲜热乎的
相关主题
logistic regression用LASSO选择变量合适吗?保险公司technical interview 会怎么问?
how do you deal with sparse data?面了一个IT公司跟机器学习相关的职位
any one did EM to find MLE of mixed effects model in RSAS问题,关于@和@@的区别
SVM (R)的结果能转成scorecard吗?请教Base 70 中的一题 关于@
SAS Logistic Regression算出来的Estimated Probability of Default太小MCMC算法的Posterior Std. 一定是减少的么?
[合集] question about MLE提高R速度的一些tips
[新手求救]怎样输出logistic regression的结果?请知道Birch's Theorem 的人进来帮帮我
Logistics forecasting 前景如何? (转载)抛砖引玉:敢问路在何方?
相关话题的讨论汇总
话题: mle话题: logistic话题: google
进入Statistics版参与讨论
1 (共1页)
k*****u
发帖数: 1688
1
看了dreamer同学的面经,发现跟我的不一样啊不一样。
因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
的。记不清了 。
后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
么选order
下一个问题好像是contingency table的问题:
先问我怎么来design看人们喜欢google 地图还是别的地图。我说那就做个survey。然
后她问我怎么处理这个survey数据。比如n个人做了这个实验。这样看上去是
contingency table啊,可是刚才面试的时候我也慌了。我说的是用开方检验。
接着问的是,除了记录他们喜欢那个地图以外,还有什么要记录的?我说的是还有
response time,客户体验,想说的挺多的就是不知道怎么用英语表达出来。
回答的太撮了,英语也说的磕磕绊绊的。然后她问我有没有问题,我问了两问题。结果
她又说还有问题。
下一个问题,这个问题我也没怎么弄明白:
使用chrome,假如有记录从开始到现在people 使用chrome上的搜索引擎的记录,那么
怎么分析这个data,客户是不是更喜欢google?
刚开始我觉得这个问题跟google地图那个一样。她说不一样,这个是有各个时间的记录
。我说这不就是时间序列么?然后问了我一些时间序列的东西。
还是这个问题,能不能做回归?y是记录值,x是时间。 我说我觉得不可以。大牛来说
说这种数据该怎么分析?
回答的挺不好的。感觉除了统计的一些知识外,还要考虑怎么设计实验。基本上给的问
题都是我们想检验某个结果,你怎么去设计实验,怎么收集data,怎么分析?
算是给后来者留点经验吧。
k*****u
发帖数: 1688
2
ps 怎么写thank you letter? 面试的人跟告诉我要面试的人不是同一个人,我没有面
试人的email,怎么写?
D******n
发帖数: 2836
3
电话的就算了吧。
h***i
发帖数: 3844
4
同学,logistic regression 的估计是用IRLS
这么经典的glm的fitting 的algorithm不记得只能怪你功课没做好了

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

x******n
发帖数: 92
5
Thanks.
w**********y
发帖数: 1691
6
I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
Contingency table..
Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
Chrome’s question…
Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….
Simplest: if you have only records for both Google and Bing, contingency table is the simplest. Paired t test maybe the second simplest?
Time..yes, if he mentioned time, do you know “trend test”?
Another simply idea is, can we model the G-B w.r.t t? G-B = bt +e..we can test b>0 <0 or =0..
“能不能做回归?” Yes or not…if yes, what is Y what is X? what you need to check? How to generalize? nonlinear, heteroskedasticity….
Then, time series..
What is the simplest time series model you learnt? AR(1)? Then bluff him with AR(1)..
Then you can also talk about how to test how many lags should be in AR or ARMA…..ACF and PACF could also be mentioned.
Have you heard of longitudinal analysis?
All in All, it should NOT be a standard qualify exam style. Open you mind! Just my 2 cents. Hope it helps!
h***i
发帖数: 3844
7
一个电面,写那么多。。。google就是要反应快,把基本的翻熟就好了

discussion with some friends interviewed by google statistical groups, they
want an open mind, quick response ppl with a solid stat background and good
skills in R(?)
further info), the interviewer already knew your background is very weak…
Iterative methods.
, instead of logistic? How to answer? If you can’t answer this question,
you need to read and think more.
undergrads..
Contingency table, right?
You!!
interviewer to the knowledge you are familiar with….

【在 w**********y 的大作中提到】
: I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
: U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
: There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
: Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
: Contingency table..
: Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
: When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
: Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
: Chrome’s question…
: Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….

D******n
发帖数: 2836
8
btw, whats the merit of knowing question 1?
I hate google, google sucks.
lol, i am just venting...
i was phone-interviewed by google too, also some contigency table question ,
thats for sure, a must ask question. But i think my answer is better than
the interviwers'.

discussion with some friends interviewed by google statistical groups, they
want an open mind, quick response ppl with a solid stat background and good
skills in R(?)
further info), the interviewer already knew your background is very weak…
Iterative methods.
, instead of logistic? How to answer? If you can’t answer this question,
you need to read and think more.
undergrads..
Contingency table, right?
You!!
interviewer to the knowledge you are familiar with….

【在 w**********y 的大作中提到】
: I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
: U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
: There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
: Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
: Contingency table..
: Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
: When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
: Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
: Chrome’s question…
: Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….

h***i
发帖数: 3844
9
haha,google 把你卡了不至于这么郁闷吧。
还可以try facebook 啊

,
they
good

【在 D******n 的大作中提到】
: btw, whats the merit of knowing question 1?
: I hate google, google sucks.
: lol, i am just venting...
: i was phone-interviewed by google too, also some contigency table question ,
: thats for sure, a must ask question. But i think my answer is better than
: the interviwers'.
:
: discussion with some friends interviewed by google statistical groups, they
: want an open mind, quick response ppl with a solid stat background and good
: skills in R(?)

D*********2
发帖数: 535
10
赞LZ。
那啥,联系你的人是recruiter,他知道面你的人的联系方式,或者你找个google的同
学给你查查。不过没啥意义,至少面我的俩巨nice的都没回信。
严重同意他家就是要反应快。没事,6个月可以继续申。
相关主题
[合集] question about MLE保险公司technical interview 会怎么问?
[新手求救]怎样输出logistic regression的结果?面了一个IT公司跟机器学习相关的职位
Logistics forecasting 前景如何? (转载)SAS问题,关于@和@@的区别
进入Statistics版参与讨论
D*********2
发帖数: 535
11

I was so pissed off by they changed my onsite to another round of phone
interview, so I uninstalled Chrome...

【在 D******n 的大作中提到】
: btw, whats the merit of knowing question 1?
: I hate google, google sucks.
: lol, i am just venting...
: i was phone-interviewed by google too, also some contigency table question ,
: thats for sure, a must ask question. But i think my answer is better than
: the interviwers'.
:
: discussion with some friends interviewed by google statistical groups, they
: want an open mind, quick response ppl with a solid stat background and good
: skills in R(?)

j*******y
发帖数: 58
12
I think LZ answered very well in logistic regression. The idea indeed is MLE
, which I learned in graduate school; the next step is to solve for MLE,
which is an algorithm problem.LZ didn't mention 'NR" or 'iterative methods',
probably this is because newton raphson and iterative methods are TOO
standard and TOO simple so that he didn't realize that this was part of the
answer.
I learned newton raphson method in the first year of college. It is as
simple as (a+b)^2=a^2+2ab+b^2.
anyone asking me how to solve for MLE will drive me crazy. I would recommend
he/she go back to college.

discussion with some friends interviewed by google statistical groups, they
want an open mind, quick response ppl with a solid stat background and good
skills in R(?)
further info), the interviewer already knew your background is very weak…
Iterative methods.
, instead of logistic? How to answer? If you can’t answer this question,
you need to read and think more.
undergrads..
Contingency table, right?
You!!
interviewer to the knowledge you are familiar with….

【在 w**********y 的大作中提到】
: I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
: U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
: There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
: Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
: Contingency table..
: Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
: When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
: Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
: Chrome’s question…
: Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….

h***i
发帖数: 3844
13
onsite 被句了起不是更伤感

【在 D*********2 的大作中提到】
:
: I was so pissed off by they changed my onsite to another round of phone
: interview, so I uninstalled Chrome...

b*****e
发帖数: 223
14
OMG, 等我有空,要好好读读醉生梦死的帖子。不是冲着 google,是纯粹出于景仰

discussion with some friends interviewed by google statistical groups, they
want an open mind, quick response ppl with a solid stat background and good
skills in R(?)
further info), the interviewer already knew your background is very weak…
Iterative methods.
, instead of logistic? How to answer? If you can’t answer this question,
you need to read and think more.
undergrads..
Contingency table, right?
You!!
interviewer to the knowledge you are familiar with….

【在 w**********y 的大作中提到】
: I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
: U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
: There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
: Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
: Contingency table..
: Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
: When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
: Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
: Chrome’s question…
: Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….

D******n
发帖数: 2836
15
nice move,
I am still using chrome though. But google is really becoming a mediocre com
pany in terms producing cool and nice products.
google buzz what a joke.
Google map also started to suck, it fails to recognize some relative new add
resses while mapquest has no problem with them.

【在 D*********2 的大作中提到】
:
: I was so pissed off by they changed my onsite to another round of phone
: interview, so I uninstalled Chrome...

k*****u
发帖数: 1688
16
哈 真惭愧啊
我记错了。只记得以前学的时候logistic回归有三个办法,刚才翻书,发现是wald,
likelihood-ratio, scoreing method。我只记得用牛顿拉普森迭代,当时记不清那三
个东东,被我说成mle了,太惭愧了。
我同学告诉我说他去google面试都是问的概率统计的概念什么的,所以我准备的都是那
些东东。结果什么都没问。
ps,google的phone interview通用么? 前面投了两个google的职位,这是面的一个。
还有一个让我给时间说要面试,会不会这个黄了,结果就会传到另一个哪儿去?

discussion with some friends interviewed by google statistical groups, they
want an open mind, quick response ppl with a solid stat background and good
skills in R(?)
further info), the interviewer already knew your background is very weak…
Iterative methods.
, instead of logistic? How to answer? If you can’t answer this question,
you need to read and think more.
undergrads..
Contingency table, right?
You!!
interviewer to the knowledge you are familiar with….

【在 w**********y 的大作中提到】
: I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
: U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
: There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
: Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
: Contingency table..
: Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
: When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
: Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
: Chrome’s question…
: Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….

D*********2
发帖数: 535
17
是通用的系统,所以有那个所谓的冰冻期。冰冻期不是说你不能申,是申了也是白申,
recruiter不会看。
不过俺脚着您这个应该可以,recruiter已经看过你的简历了。
好好准备。BLESS!

they
good

【在 k*****u 的大作中提到】
: 哈 真惭愧啊
: 我记错了。只记得以前学的时候logistic回归有三个办法,刚才翻书,发现是wald,
: likelihood-ratio, scoreing method。我只记得用牛顿拉普森迭代,当时记不清那三
: 个东东,被我说成mle了,太惭愧了。
: 我同学告诉我说他去google面试都是问的概率统计的概念什么的,所以我准备的都是那
: 些东东。结果什么都没问。
: ps,google的phone interview通用么? 前面投了两个google的职位,这是面的一个。
: 还有一个让我给时间说要面试,会不会这个黄了,结果就会传到另一个哪儿去?
:
: discussion with some friends interviewed by google statistical groups, they

b*******t
发帖数: 117
18
多谢分享

看了dreamer同学的面经,发现跟我的不一样啊不一样。
因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
的。记不清了 。
后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
么选order
下一个问题好像是contingency table的问题:
先问我怎么来design看人们喜欢google 地图还是别的地图。我说那就做个survey。然
后她问我怎么处理这个survey数据。比如n个人做了这个实验。这样看上去是
contingency table啊,可是刚才面试的时候我也慌了。我说的是用开方检验。
接着问的是,除了记录他们喜欢那个地图以外,还有什么要记录的?我说的是还有
response time,客户体验,想说的挺多的就是不知道怎么用英语表达出来。
回答的太撮了,英语也说的磕磕绊绊的。然后她问我有没有问题,我问了两问题。结果
她又说还有问题。
下一个问题,这个问题我也没怎么弄明白:
使用chrome,假如有记录从开始到现在people 使用chrome上的搜索引擎的记录,那么
怎么分析这个data,客户是不是更喜欢google?
刚开始我觉得这个问题跟google地图那个一样。她说不一样,这个是有各个时间的记录
。我说这不就是时间序列么?然后问了我一些时间序列的东西。
还是这个问题,能不能做回归?y是记录值,x是时间。 我说我觉得不可以。大牛来说
说这种数据该怎么分析?
回答的挺不好的。感觉除了统计的一些知识外,还要考虑怎么设计实验。基本上给的问
题都是我们想检验某个结果,你怎么去设计实验,怎么收集data,怎么分析?
算是给后来者留点经验吧。

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

H*******s
发帖数: 382
19
thanks

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

h***i
发帖数: 3844
20
同学,你做chi square test么? 这和estimation 有什么关系。。。
应该去翻翻bickel的book,或者shaojun的book。。。。。

they
good

【在 k*****u 的大作中提到】
: 哈 真惭愧啊
: 我记错了。只记得以前学的时候logistic回归有三个办法,刚才翻书,发现是wald,
: likelihood-ratio, scoreing method。我只记得用牛顿拉普森迭代,当时记不清那三
: 个东东,被我说成mle了,太惭愧了。
: 我同学告诉我说他去google面试都是问的概率统计的概念什么的,所以我准备的都是那
: 些东东。结果什么都没问。
: ps,google的phone interview通用么? 前面投了两个google的职位,这是面的一个。
: 还有一个让我给时间说要面试,会不会这个黄了,结果就会传到另一个哪儿去?
:
: discussion with some friends interviewed by google statistical groups, they

相关主题
请教Base 70 中的一题 关于@请知道Birch's Theorem 的人进来帮帮我
MCMC算法的Posterior Std. 一定是减少的么?抛砖引玉:敢问路在何方?
提高R速度的一些tips[合集] 关于统计文献检索
进入Statistics版参与讨论
j*******y
发帖数: 58
21
what does that mean 'logistic regression has 3 methods, wald, LR and scoring
method'?
wald, lr and score test are testing methods which requiring
estimates of unknown parameters in the logistic regression. the estimating
is done by MLE and the computation is done by NR or iterative methods.
actually wald, lr and score test are asymptotially the same. All these are
broadly based on MLE idea. When you try to mazimize a function, you can take
derivative of the function and it becomes first order derivative = 0, an
equation problem. you can play with this equation and get different forms,
and will eventually become 'unlike' MLE. But the father is
always MLE.

they
good

【在 k*****u 的大作中提到】
: 哈 真惭愧啊
: 我记错了。只记得以前学的时候logistic回归有三个办法,刚才翻书,发现是wald,
: likelihood-ratio, scoreing method。我只记得用牛顿拉普森迭代,当时记不清那三
: 个东东,被我说成mle了,太惭愧了。
: 我同学告诉我说他去google面试都是问的概率统计的概念什么的,所以我准备的都是那
: 些东东。结果什么都没问。
: ps,google的phone interview通用么? 前面投了两个google的职位,这是面的一个。
: 还有一个让我给时间说要面试,会不会这个黄了,结果就会传到另一个哪儿去?
:
: discussion with some friends interviewed by google statistical groups, they

e**y
发帖数: 51
22
前面那么多人说了一堆平庸的话,就你这话看着还算实在。说起来,logistic
regression的解法远远不止前面的人所说的那三种。而人家答一个mle,在他们眼里就
跟错到哪里去了一样。你们对统计的理解何其的平庸啊!算法只是算法,跟logistic
regression木有关系!

MLE
',
the
recommend

【在 j*******y 的大作中提到】
: I think LZ answered very well in logistic regression. The idea indeed is MLE
: , which I learned in graduate school; the next step is to solve for MLE,
: which is an algorithm problem.LZ didn't mention 'NR" or 'iterative methods',
: probably this is because newton raphson and iterative methods are TOO
: standard and TOO simple so that he didn't realize that this was part of the
: answer.
: I learned newton raphson method in the first year of college. It is as
: simple as (a+b)^2=a^2+2ab+b^2.
: anyone asking me how to solve for MLE will drive me crazy. I would recommend
: he/she go back to college.

h***i
发帖数: 3844
23
那三种是解法么?很费解,典型的chi square test居然和logistic regression的解法
联系在一起。你说个MM or GMM之类的还算叫解法。

【在 e**y 的大作中提到】
: 前面那么多人说了一堆平庸的话,就你这话看着还算实在。说起来,logistic
: regression的解法远远不止前面的人所说的那三种。而人家答一个mle,在他们眼里就
: 跟错到哪里去了一样。你们对统计的理解何其的平庸啊!算法只是算法,跟logistic
: regression木有关系!
:
: MLE
: ',
: the
: recommend

D*********2
发帖数: 535
24
那啥,我来抛个砖,答一下Chrome那题。
首先,我个人认为causal inference是关键词。题目中数据是从Chrome采集的,
observational data需要correct potential bias。有个面试官跟我提过,a common
believe will be Chrome user have better tech level or geek level ;p 由此,用
户选择google而不选择bing,可能是用户的不同,而不是search engine的不同。所以
,用Chrome采集的数据进行search engine的比较,需要先reduce potential bias,一
个比较popular的方法是causal inference。key idea就是matching,根据用户的地域
、性别、年龄等进行matching,把背景搞的越相似越好,这样测量出的difference就是
search engine自身的优劣了。有兴趣的可以参考今年Elizabeth Stuart在statistical
sciense上发的一片review。还有robin童鞋一片帮某药厂marketing部门做的
prescription的分析。
其次,至于时间,个人觉得longitudinal,repeated measurement都OK,因为这里time
不应该是一个关键变量。我实在不明白monitor user不同时间段用不同搜索引擎有啥可
研究的。A interesting problem might be how Chrome would train user to have
better search habit (say use google), but that's another story.
over, my 2 cents.
like I said, to me, it is very exhausting to prepare google interviews,
their questions really cover a lot :(
D*********2
发帖数: 535
25

恩,我们前段时间有个来应聘的faculty说过,他认为统计应该跟其他专业多结合,比
如这种算最大最小值的问题完全不用自己瞎折腾,直接写出公式外包给CS。。。

【在 e**y 的大作中提到】
: 前面那么多人说了一堆平庸的话,就你这话看着还算实在。说起来,logistic
: regression的解法远远不止前面的人所说的那三种。而人家答一个mle,在他们眼里就
: 跟错到哪里去了一样。你们对统计的理解何其的平庸啊!算法只是算法,跟logistic
: regression木有关系!
:
: MLE
: ',
: the
: recommend

m****e
发帖数: 255
26
这就是现在的困境,无论理论的还是应用都要计算,而搞计算的只要和实际数据结合起
来就发现复杂的模型还不如linear model,regression,其他的MC, HMM什么的CS的人都
会,所以作统计还不如到cs搞machine learning. Only my 2cents

【在 D*********2 的大作中提到】
:
: 恩,我们前段时间有个来应聘的faculty说过,他认为统计应该跟其他专业多结合,比
: 如这种算最大最小值的问题完全不用自己瞎折腾,直接写出公式外包给CS。。。

m****e
发帖数: 255
27
I agree with you on the causal inference part. It is actually important in
analyzing data but most of programs do not teach this kind of stuff at least
not in separate courses.

statistical

【在 D*********2 的大作中提到】
: 那啥,我来抛个砖,答一下Chrome那题。
: 首先,我个人认为causal inference是关键词。题目中数据是从Chrome采集的,
: observational data需要correct potential bias。有个面试官跟我提过,a common
: believe will be Chrome user have better tech level or geek level ;p 由此,用
: 户选择google而不选择bing,可能是用户的不同,而不是search engine的不同。所以
: ,用Chrome采集的数据进行search engine的比较,需要先reduce potential bias,一
: 个比较popular的方法是causal inference。key idea就是matching,根据用户的地域
: 、性别、年龄等进行matching,把背景搞的越相似越好,这样测量出的difference就是
: search engine自身的优劣了。有兴趣的可以参考今年Elizabeth Stuart在statistical
: sciense上发的一片review。还有robin童鞋一片帮某药厂marketing部门做的

h***i
发帖数: 3844
28
如果cs的真的这么强,那就统计的job就不会招统计的了。

【在 m****e 的大作中提到】
: 这就是现在的困境,无论理论的还是应用都要计算,而搞计算的只要和实际数据结合起
: 来就发现复杂的模型还不如linear model,regression,其他的MC, HMM什么的CS的人都
: 会,所以作统计还不如到cs搞machine learning. Only my 2cents

m****e
发帖数: 255
29
统计的job不只限统计,很多只要quantitative background就行。
D*********2
发帖数: 535
30

我觉得侧重还是不同。Statistics models have better interpretability. 恕我固陋
,我还真没见过几个CS的人真正对咱建design, model building和model
interpretation这块有兴趣。

【在 h***i 的大作中提到】
: 如果cs的真的这么强,那就统计的job就不会招统计的了。
相关主题
最大似然估计和最大后验估计究竟是什么东东?how do you deal with sparse data?
请教一个曲面拟合问题any one did EM to find MLE of mixed effects model in R
logistic regression用LASSO选择变量合适吗?SVM (R)的结果能转成scorecard吗?
进入Statistics版参与讨论
D*********2
发帖数: 535
31

恩,我读到有job description说any -matician,不管做化学、经济、数学...

【在 m****e 的大作中提到】
: 统计的job不只限统计,很多只要quantitative background就行。
D*********2
发帖数: 535
32
right. that was exactly what google interviewers told me.
one interviewer even asked me to read the names of all the courses I have
taken. he stopped me when I reached causal inference. i wasn't prepared for
causal inference, but I realize his reaction meant something. So, I answered
questions accordingly. i guess that's why i passed the first round, i got
lucky. later on I did my research, and found several papers they wrote. one
could search for Dr. Lambert's papers if interested.

least

【在 m****e 的大作中提到】
: I agree with you on the causal inference part. It is actually important in
: analyzing data but most of programs do not teach this kind of stuff at least
: not in separate courses.
:
: statistical

d******e
发帖数: 7844
33
... ...只能说你真的很孤陋寡闻,CS里有很多人都在搞统计模型。Berkeley的Martin
Wainwright等,MIT的Alan Willsky等,CMU的John Lafferty。这些人不光在CS里是大
牛,在统计里也有举足轻重的地位啊,在Annals of Statistics上也经常露脸的啊。

【在 D*********2 的大作中提到】
: right. that was exactly what google interviewers told me.
: one interviewer even asked me to read the names of all the courses I have
: taken. he stopped me when I reached causal inference. i wasn't prepared for
: causal inference, but I realize his reaction meant something. So, I answered
: questions accordingly. i guess that's why i passed the first round, i got
: lucky. later on I did my research, and found several papers they wrote. one
: could search for Dr. Lambert's papers if interested.
:
: least

D*********2
发帖数: 535
34
true. I found those stanford profs are damn smart, they moved to this area
in the last century...

【在 m****e 的大作中提到】
: 这就是现在的困境,无论理论的还是应用都要计算,而搞计算的只要和实际数据结合起
: 来就发现复杂的模型还不如linear model,regression,其他的MC, HMM什么的CS的人都
: 会,所以作统计还不如到cs搞machine learning. Only my 2cents

d******e
发帖数: 7844
35
CS!=coding的

【在 D*********2 的大作中提到】
: true. I found those stanford profs are damn smart, they moved to this area
: in the last century...

D*********2
发帖数: 535
36
谢指点。
BTW,您哪能总批评我。。。

【在 d******e 的大作中提到】
: ... ...只能说你真的很孤陋寡闻,CS里有很多人都在搞统计模型。Berkeley的Martin
: Wainwright等,MIT的Alan Willsky等,CMU的John Lafferty。这些人不光在CS里是大
: 牛,在统计里也有举足轻重的地位啊,在Annals of Statistics上也经常露脸的啊。

D*********2
发帖数: 535
37
你难能又如此愤青。。。莫非当年CS的? //run
没,我知道他们不只coding... 我只以为他们更侧重写啥最快最优的algorithm,比如找找最大数啊,算算最大值啊... 顶锅盖跑...

【在 d******e 的大作中提到】
: CS!=coding的
d******e
发帖数: 7844
38
统计的人应该换换脑筋了,是统计的人应该开始学习如何coding,如何做计算。
Bin Yu有个说法,现在搞的是3rd generation statistics,Computing已经完全融入统
计,不懂computing的人是很难处理modern statistics里的复杂模型的。

【在 D*********2 的大作中提到】
: 你难能又如此愤青。。。莫非当年CS的? //run
: 没,我知道他们不只coding... 我只以为他们更侧重写啥最快最优的algorithm,比如找找最大数啊,算算最大值啊... 顶锅盖跑...

d******e
发帖数: 7844
39
我咋总批你了?

【在 D*********2 的大作中提到】
: 谢指点。
: BTW,您哪能总批评我。。。

d******e
发帖数: 7844
40
你对Modern Statistics的了解太片面了。

【在 D*********2 的大作中提到】
: 你难能又如此愤青。。。莫非当年CS的? //run
: 没,我知道他们不只coding... 我只以为他们更侧重写啥最快最优的algorithm,比如找找最大数啊,算算最大值啊... 顶锅盖跑...

相关主题
SVM (R)的结果能转成scorecard吗?[新手求救]怎样输出logistic regression的结果?
SAS Logistic Regression算出来的Estimated Probability of Default太小Logistics forecasting 前景如何? (转载)
[合集] question about MLE保险公司technical interview 会怎么问?
进入Statistics版参与讨论
D*********2
发帖数: 535
41

上次有个人问linear model,您大喝“打回去重学”。。。
不过俺不得不承认您批评的有理,就是态度不够温柔~
谢谢那~

【在 d******e 的大作中提到】
: 我咋总批你了?
d******e
发帖数: 7844
42
Don't forget J. Friedman and T. Hastie are also very good coders.
Most of their papers focus on Models and Algorithms for Computing (More
practical), not Proof(Less mathematical).
In my opinion, their style is typical in 3rd generation statistics.

【在 D*********2 的大作中提到】
: true. I found those stanford profs are damn smart, they moved to this area
: in the last century...

D*********2
发帖数: 535
43
agree,但总得有侧重把,CS也是狂大一领域不是。咱也得去研究咋算最省内存?咋存
比较省力?

【在 d******e 的大作中提到】
: 统计的人应该换换脑筋了,是统计的人应该开始学习如何coding,如何做计算。
: Bin Yu有个说法,现在搞的是3rd generation statistics,Computing已经完全融入统
: 计,不懂computing的人是很难处理modern statistics里的复杂模型的。

d******e
发帖数: 7844
44
统计里有很多人都在搞计算啊,研究更快的优化算法,更有效率。这个现象在生统里就
更常见了阿。

【在 D*********2 的大作中提到】
: agree,但总得有侧重把,CS也是狂大一领域不是。咱也得去研究咋算最省内存?咋存
: 比较省力?

B******5
发帖数: 4676
45
有的时候data太大了还真的需要研究一下的。。。

【在 D*********2 的大作中提到】
: agree,但总得有侧重把,CS也是狂大一领域不是。咱也得去研究咋算最省内存?咋存
: 比较省力?

D*********2
发帖数: 535
46
恩恩,对的,谢谢指点。
btw,加了俩“啊”果然读起来不一样撒,您没觉得您温柔了许多~ \run.

【在 d******e 的大作中提到】
: 统计里有很多人都在搞计算啊,研究更快的优化算法,更有效率。这个现象在生统里就
: 更常见了阿。

j*******y
发帖数: 58
47
this would be the reason that this guy didn't get the job if he didn't get
it.
computing is a very important part of stat.

【在 D*********2 的大作中提到】
: 恩恩,对的,谢谢指点。
: btw,加了俩“啊”果然读起来不一样撒,您没觉得您温柔了许多~ \run.

j*******y
发帖数: 58
48
using CS people can compute the P value, and by using stat people can
explain P value.
好比是cs的同学炒出一盘无味的菜,stat同学的任务是向别人解释这盘菜其实很好吃,
并让人们心服口服。that is the most difficult part.

【在 h***i 的大作中提到】
: 如果cs的真的这么强,那就统计的job就不会招统计的了。
j*******y
发帖数: 58
49
true,
stat = why coding and what to code
cs = how to code

【在 d******e 的大作中提到】
: CS!=coding的
d******e
发帖数: 7844
50
呵呵,又来一个。
这年头很多CS的人做到前两点已经不是什么稀奇的事情了。

【在 j*******y 的大作中提到】
: true,
: stat = why coding and what to code
: cs = how to code

相关主题
面了一个IT公司跟机器学习相关的职位MCMC算法的Posterior Std. 一定是减少的么?
SAS问题,关于@和@@的区别提高R速度的一些tips
请教Base 70 中的一题 关于@请知道Birch's Theorem 的人进来帮帮我
进入Statistics版参与讨论
j*******y
发帖数: 58
51
也许stat和cs都能炼成仙丹,也许cs炼成仙丹的工艺更加复杂,但是stat更能让别人以
为吃了仙丹可以长生不老。所以招cs一般都要考coding,招stat一般都要考
communication。

【在 d******e 的大作中提到】
: 呵呵,又来一个。
: 这年头很多CS的人做到前两点已经不是什么稀奇的事情了。

D*********2
发帖数: 535
52
牛的!上次Jun Shao童鞋来系里吃饭的时候谈到,统计就是一art,我们怎么建模都可
以,关键在自圆其说。衡量model好坏的标准其实很模糊......后来,后来我就去抢吃
的没继续听了,buffet那~

【在 j*******y 的大作中提到】
: using CS people can compute the P value, and by using stat people can
: explain P value.
: 好比是cs的同学炒出一盘无味的菜,stat同学的任务是向别人解释这盘菜其实很好吃,
: 并让人们心服口服。that is the most difficult part.

D*********2
发帖数: 535
53
他还真fail了。

【在 j*******y 的大作中提到】
: this would be the reason that this guy didn't get the job if he didn't get
: it.
: computing is a very important part of stat.

C*******1
发帖数: 2134
54
统计我日其实就是半个文科。
很适合坑蒙拐骗。

【在 D*********2 的大作中提到】
: 牛的!上次Jun Shao童鞋来系里吃饭的时候谈到,统计就是一art,我们怎么建模都可
: 以,关键在自圆其说。衡量model好坏的标准其实很模糊......后来,后来我就去抢吃
: 的没继续听了,buffet那~

j*******y
发帖数: 58
55
totally wrong. 你还是要会玩测度,玩概率,玩矩阵,玩收敛,玩计算。

【在 C*******1 的大作中提到】
: 统计我日其实就是半个文科。
: 很适合坑蒙拐骗。

h***i
发帖数: 3844
56
有道理,证明搞不过math,coding搞不过CS,有人说统计可以取2个的中间,比这两都
强,现在math有人转统计,CS也开始玩统计,以后要
彻底把统计封杀了。

【在 C*******1 的大作中提到】
: 统计我日其实就是半个文科。
: 很适合坑蒙拐骗。

h***i
发帖数: 3844
57
数学是art,统计就算了,混口饭的手艺活。好比 搞美术的vs 搞装修的。

【在 D*********2 的大作中提到】
: 牛的!上次Jun Shao童鞋来系里吃饭的时候谈到,统计就是一art,我们怎么建模都可
: 以,关键在自圆其说。衡量model好坏的标准其实很模糊......后来,后来我就去抢吃
: 的没继续听了,buffet那~

j*******y
发帖数: 58
58
别忘了很多搞装修的都是搞美术出身。

【在 h***i 的大作中提到】
: 数学是art,统计就算了,混口饭的手艺活。好比 搞美术的vs 搞装修的。
h***i
发帖数: 3844
59
嗯,但要把搞装修的拔高到搞美术的那个高度就过了。最开始都是专业搞美术的来玩装修,装修能赚到钱,结果,慢慢美术搞不下去的一部分来玩装修了。。。,不过搞美术的还是喜欢在装修中体现美术,结果忽略了对装修的速度的追求,有的雇主可能对装修的速度更在意,现在慢慢的一帮子素以快为美的也进入这个行业了。。。

【在 j*******y 的大作中提到】
: 别忘了很多搞装修的都是搞美术出身。
j*******y
发帖数: 58
60
搞装修的不是你想的那样。装修也不是砌砖垒墙。
装修第一种境界是粉刷墙壁,这是本科生。
装修第二种境界就是像米开朗基罗在西斯廷教堂做的天顶壁画,漂亮大家都看得见。这
是master。
装修最高境界是有能力画壁画,但是没有,而是在墙上随便用榔头凿几个洞,然后让所
有的人都相信这是最牛x的艺术成就。这是phd。

【在 h***i 的大作中提到】
: 嗯,但要把搞装修的拔高到搞美术的那个高度就过了。最开始都是专业搞美术的来玩装修,装修能赚到钱,结果,慢慢美术搞不下去的一部分来玩装修了。。。,不过搞美术的还是喜欢在装修中体现美术,结果忽略了对装修的速度的追求,有的雇主可能对装修的速度更在意,现在慢慢的一帮子素以快为美的也进入这个行业了。。。
相关主题
抛砖引玉:敢问路在何方?请教一个曲面拟合问题
[合集] 关于统计文献检索logistic regression用LASSO选择变量合适吗?
最大似然估计和最大后验估计究竟是什么东东?how do you deal with sparse data?
进入Statistics版参与讨论
D******n
发帖数: 2836
61
这楼早歪了。我个人认为要把industry跟学术界分开,否则讨论来没有意义。
工业界的统计工作大部分工作还真不用知道这logistic怎么solve,真需要知道也真是闲
得蛋疼。最重要的能力应该是怎么把business的问题用最简单又最有效的方法解决。
当然google是top IT公司,招个统计也爱问这些问题也很正常,大吧人去,不多问些问
题咋整啊?但是对公司有多大裨益,我真的是不知道。反正这公司挺sucks(哈哈,被拒
一直怨恨到现在)。

装修,装修能赚到钱,结果,慢慢美术搞不下去的一部分来玩装修了。。。,不过搞美
术的还是喜欢在装修中体现美术,结果忽略了对装修的速度的追求,有的雇主可能对装
修的速度更在意,现在慢慢

【在 h***i 的大作中提到】
: 嗯,但要把搞装修的拔高到搞美术的那个高度就过了。最开始都是专业搞美术的来玩装修,装修能赚到钱,结果,慢慢美术搞不下去的一部分来玩装修了。。。,不过搞美术的还是喜欢在装修中体现美术,结果忽略了对装修的速度的追求,有的雇主可能对装修的速度更在意,现在慢慢的一帮子素以快为美的也进入这个行业了。。。
h***i
发帖数: 3844
62
你还可以try facebook 嘛,哪天post上来让大家观摩一下。。。

是闲
被拒

【在 D******n 的大作中提到】
: 这楼早歪了。我个人认为要把industry跟学术界分开,否则讨论来没有意义。
: 工业界的统计工作大部分工作还真不用知道这logistic怎么solve,真需要知道也真是闲
: 得蛋疼。最重要的能力应该是怎么把business的问题用最简单又最有效的方法解决。
: 当然google是top IT公司,招个统计也爱问这些问题也很正常,大吧人去,不多问些问
: 题咋整啊?但是对公司有多大裨益,我真的是不知道。反正这公司挺sucks(哈哈,被拒
: 一直怨恨到现在)。
:
: 装修,装修能赚到钱,结果,慢慢美术搞不下去的一部分来玩装修了。。。,不过搞美
: 术的还是喜欢在装修中体现美术,结果忽略了对装修的速度的追求,有的雇主可能对装
: 修的速度更在意,现在慢慢

D******n
发帖数: 2836
63
没这个水平,我不是统计phd,我想我基本没戏。

【在 h***i 的大作中提到】
: 你还可以try facebook 嘛,哪天post上来让大家观摩一下。。。
:
: 是闲
: 被拒

h***i
发帖数: 3844
64
没事,google interview你的也不一定是统计phd,很多都是他们说的CS的phd

【在 D******n 的大作中提到】
: 没这个水平,我不是统计phd,我想我基本没戏。
s********a
发帖数: 328
65
I think you are wrong about the logistic part.
Method for solving Logistic Regression (independent responses) IS MLE, and
the problem is solving the score equation. When you use Fisher Scoring (
close
to Newton-Raphson except that Fisher Scoring uses expected second derivative
instead of real second derivative), it is Equivalent to IRLS in some form.
So
IRLS is a way of solving the MLE score equation. Refer to Nelder, Wedderburn
1972. However, when responses are not independent, MLE is not available and
you'll need to use GEE.

discussion with some friends interviewed by google statistical groups, they
want an open mind, quick response ppl with a solid stat background and good
skills in R(?)
further info), the interviewer already knew your background is very weak…
Iterative methods.
,
instead of logistic? How to answer? If you can’t answer this question, you
need to read and think more.
undergrads..
Contingency table, right?
You!!
interviewer to the knowledge you are familiar with….

【在 w**********y 的大作中提到】
: I think you didn’t get the spirit of the google interview. Based on the discussion with some friends interviewed by google statistical groups, they want an open mind, quick response ppl with a solid stat background and good skills in R(?)
: U did so bad in Logistic regression…When you answered MLE (without any further info), the interviewer already knew your background is very weak…
: There is no close form MLE. You need to either use Newton-Raphson or Iterative methods.
: Open you mind..if they ask you, can we do the linear regression: P = bX +e, instead of logistic? How to answer? If you can’t answer this question, you need to read and think more.
: Contingency table..
: Frankly, I never learnt this kind of staff..But I taught that for some undergrads..
: When you learnt the ANOVA, you also should learn the connection with Contingency table, right?
: Chi square, fisher’s exact test..It is also on Casella’s book, You Mei You!!
: Chrome’s question…
: Actually, there is no standard answer..Open your mind!! Try to attract the interviewer to the knowledge you are familiar with….

h***i
发帖数: 3844
66
he can also try mixed model. even for independent case, sometimes, it has
overdispersion problem, so, he can try mixture model.

derivative
Wedderburn
and

【在 s********a 的大作中提到】
: I think you are wrong about the logistic part.
: Method for solving Logistic Regression (independent responses) IS MLE, and
: the problem is solving the score equation. When you use Fisher Scoring (
: close
: to Newton-Raphson except that Fisher Scoring uses expected second derivative
: instead of real second derivative), it is Equivalent to IRLS in some form.
: So
: IRLS is a way of solving the MLE score equation. Refer to Nelder, Wedderburn
: 1972. However, when responses are not independent, MLE is not available and
: you'll need to use GEE.

D******n
发帖数: 2836
67
我那个我是做过功课的,面我那个人是统计phd,还做过assitant professor,我还去
看了他一篇文章,想学习一下google的统计方法,发现里面只是一些discriptive
statistics,怔住了。

【在 h***i 的大作中提到】
: 没事,google interview你的也不一定是统计phd,很多都是他们说的CS的phd
h***i
发帖数: 3844
68
phone就不用太伤感了,就当聊个天嘛。

【在 D******n 的大作中提到】
: 我那个我是做过功课的,面我那个人是统计phd,还做过assitant professor,我还去
: 看了他一篇文章,想学习一下google的统计方法,发现里面只是一些discriptive
: statistics,怔住了。

D******n
发帖数: 2836
69
所以我就来气了嘛,要求那么高,逗我玩干嘛,他家就是喜欢海面。

【在 h***i 的大作中提到】
: phone就不用太伤感了,就当聊个天嘛。
h***i
发帖数: 3844
70
......,要想去以后再try就好了,也不就是只有他一家,social network company很多吧

【在 D******n 的大作中提到】
: 所以我就来气了嘛,要求那么高,逗我玩干嘛,他家就是喜欢海面。
相关主题
how do you deal with sparse data?SAS Logistic Regression算出来的Estimated Probability of Default太小
any one did EM to find MLE of mixed effects model in R[合集] question about MLE
SVM (R)的结果能转成scorecard吗?[新手求救]怎样输出logistic regression的结果?
进入Statistics版参与讨论
j*******y
发帖数: 58
71
ft,descriptive stats是统计的达摩老祖。

【在 D******n 的大作中提到】
: 我那个我是做过功课的,面我那个人是统计phd,还做过assitant professor,我还去
: 看了他一篇文章,想学习一下google的统计方法,发现里面只是一些discriptive
: statistics,怔住了。

a******n
发帖数: 11246
72
非常感谢啊niu兄的分享。
关于logistic regression的参数估计,如果是我的话,
我估计会说,这个reg相当于把Y通过logit transform后
变成新的Y',然后Y'关于Xb regress。就用普通的least square
method就行了。大牛们说说这样能行吗?
关于MLE怎么做,我觉得就是把likelihood function写出来,求
最大值。那个NR method是算法的问题了...但是理论上
无非就是求likelihood的最大值。
另外看到提到了dreamer同学,在本版搜索了一下,才
发现原来几个月前dreamer就发过面经了。看了一下,觉得
好难啊。有好多我都觉得我无法给出肯定的回答:(

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

k*****u
发帖数: 1688
73
Alan那本书CDA的143页写的很清楚了,是要找MLE
给的几个方法是:牛顿拉普森, fisher scoring, Iterative reweighted least
squares. 然后给了在经典link下牛顿和肥西的办法是一个结果。
大牛们能不能说说,如果logistic下面y和x不是线性的,怎么搞?ps,我记得以前说线
性回归,是指参数beta是线性的。是不是这样?如果照他们说的,y x不是线性的,实
际当中你们一般怎么做的?
k*****u
发帖数: 1688
74
Re,这个要记下。不独立的时候要GEE

derivative
Wedderburn
and

【在 s********a 的大作中提到】
: I think you are wrong about the logistic part.
: Method for solving Logistic Regression (independent responses) IS MLE, and
: the problem is solving the score equation. When you use Fisher Scoring (
: close
: to Newton-Raphson except that Fisher Scoring uses expected second derivative
: instead of real second derivative), it is Equivalent to IRLS in some form.
: So
: IRLS is a way of solving the MLE score equation. Refer to Nelder, Wedderburn
: 1972. However, when responses are not independent, MLE is not available and
: you'll need to use GEE.

A*******s
发帖数: 3942
75
应该不行吧,logit transform的不是y 而是y_bar, y_bar 一般来说你是很难直接观测
到的。

【在 a******n 的大作中提到】
: 非常感谢啊niu兄的分享。
: 关于logistic regression的参数估计,如果是我的话,
: 我估计会说,这个reg相当于把Y通过logit transform后
: 变成新的Y',然后Y'关于Xb regress。就用普通的least square
: method就行了。大牛们说说这样能行吗?
: 关于MLE怎么做,我觉得就是把likelihood function写出来,求
: 最大值。那个NR method是算法的问题了...但是理论上
: 无非就是求likelihood的最大值。
: 另外看到提到了dreamer同学,在本版搜索了一下,才
: 发现原来几个月前dreamer就发过面经了。看了一下,觉得

A*******s
发帖数: 3942
76
还是用线性回归啊,只不过得引入非线性的基,比如说陈大师穷尽一生研究的splines。

【在 k*****u 的大作中提到】
: Alan那本书CDA的143页写的很清楚了,是要找MLE
: 给的几个方法是:牛顿拉普森, fisher scoring, Iterative reweighted least
: squares. 然后给了在经典link下牛顿和肥西的办法是一个结果。
: 大牛们能不能说说,如果logistic下面y和x不是线性的,怎么搞?ps,我记得以前说线
: 性回归,是指参数beta是线性的。是不是这样?如果照他们说的,y x不是线性的,实
: 际当中你们一般怎么做的?

h***i
发帖数: 3844
77
use nonparametric

【在 k*****u 的大作中提到】
: Alan那本书CDA的143页写的很清楚了,是要找MLE
: 给的几个方法是:牛顿拉普森, fisher scoring, Iterative reweighted least
: squares. 然后给了在经典link下牛顿和肥西的办法是一个结果。
: 大牛们能不能说说,如果logistic下面y和x不是线性的,怎么搞?ps,我记得以前说线
: 性回归,是指参数beta是线性的。是不是这样?如果照他们说的,y x不是线性的,实
: 际当中你们一般怎么做的?

a******n
发帖数: 11246
78
oh...我一会儿再去看看generalized linear model的书
thanks.

【在 A*******s 的大作中提到】
: 应该不行吧,logit transform的不是y 而是y_bar, y_bar 一般来说你是很难直接观测
: 到的。

L**********A
发帖数: 7115
79
还要再assess model assumptions

【在 a******n 的大作中提到】
: oh...我一会儿再去看看generalized linear model的书
: thanks.

a******n
发帖数: 11246
80
小车你也读统计的?

【在 L**********A 的大作中提到】
: 还要再assess model assumptions
相关主题
Logistics forecasting 前景如何? (转载)SAS问题,关于@和@@的区别
保险公司technical interview 会怎么问?请教Base 70 中的一题 关于@
面了一个IT公司跟机器学习相关的职位MCMC算法的Posterior Std. 一定是减少的么?
进入Statistics版参与讨论
P****D
发帖数: 11146
81
对于这个问题,如果回答“引入splines”,对方可能会追问“如何引入?”如果在这
方面的基础并不很扎实的,这样被追着打很狼狈。还不如采取主动,自己说,“可以
transform或加入高阶的term,取决于数据的实际情况。如何transform,也要借用前人
的经验、行业里普遍使用的方法、我们本来的hypothesis、还有数据的实际情况。我们
可以用图表或简单的descriptive statistics来初步探索y和x的关系,到底是不是线性
的。”
面试时说废话的技巧很重要!如果不熟悉的领域,想办法推卸掉,尽量自己主动多说,
从而把对方追着问的可能给堵上。

splines。

【在 A*******s 的大作中提到】
: 还是用线性回归啊,只不过得引入非线性的基,比如说陈大师穷尽一生研究的splines。
A*******s
发帖数: 3942
82
很赞...

【在 P****D 的大作中提到】
: 对于这个问题,如果回答“引入splines”,对方可能会追问“如何引入?”如果在这
: 方面的基础并不很扎实的,这样被追着打很狼狈。还不如采取主动,自己说,“可以
: transform或加入高阶的term,取决于数据的实际情况。如何transform,也要借用前人
: 的经验、行业里普遍使用的方法、我们本来的hypothesis、还有数据的实际情况。我们
: 可以用图表或简单的descriptive statistics来初步探索y和x的关系,到底是不是线性
: 的。”
: 面试时说废话的技巧很重要!如果不熟悉的领域,想办法推卸掉,尽量自己主动多说,
: 从而把对方追着问的可能给堵上。
:
: splines。

h***i
发帖数: 3844
83
公司不会没事用spline吧,公司爱用linear regression及其变种, spline这种玩意公
司如果有人interview 问了显得多不专业。

【在 P****D 的大作中提到】
: 对于这个问题,如果回答“引入splines”,对方可能会追问“如何引入?”如果在这
: 方面的基础并不很扎实的,这样被追着打很狼狈。还不如采取主动,自己说,“可以
: transform或加入高阶的term,取决于数据的实际情况。如何transform,也要借用前人
: 的经验、行业里普遍使用的方法、我们本来的hypothesis、还有数据的实际情况。我们
: 可以用图表或简单的descriptive statistics来初步探索y和x的关系,到底是不是线性
: 的。”
: 面试时说废话的技巧很重要!如果不熟悉的领域,想办法推卸掉,尽量自己主动多说,
: 从而把对方追着问的可能给堵上。
:
: splines。

P****D
发帖数: 11146
84
1. 我主要说的是讲废话的技巧。
2. 耗费了陈大师13年生命的,标志着统计学的新地平线的技术,你敢无视?!砍掉重
练吧!

【在 h***i 的大作中提到】
: 公司不会没事用spline吧,公司爱用linear regression及其变种, spline这种玩意公
: 司如果有人interview 问了显得多不专业。

k*****u
发帖数: 1688
85
确实是这样啊。
我说用多项式回归,然后考虑怎么选择order。结果立刻就被追问怎么选择。

【在 P****D 的大作中提到】
: 对于这个问题,如果回答“引入splines”,对方可能会追问“如何引入?”如果在这
: 方面的基础并不很扎实的,这样被追着打很狼狈。还不如采取主动,自己说,“可以
: transform或加入高阶的term,取决于数据的实际情况。如何transform,也要借用前人
: 的经验、行业里普遍使用的方法、我们本来的hypothesis、还有数据的实际情况。我们
: 可以用图表或简单的descriptive statistics来初步探索y和x的关系,到底是不是线性
: 的。”
: 面试时说废话的技巧很重要!如果不熟悉的领域,想办法推卸掉,尽量自己主动多说,
: 从而把对方追着问的可能给堵上。
:
: splines。

L**********A
发帖数: 7115
86
fractional polynomials?

【在 k*****u 的大作中提到】
: 确实是这样啊。
: 我说用多项式回归,然后考虑怎么选择order。结果立刻就被追问怎么选择。

y*****w
发帖数: 1350
87
Up! This is not only an interview skill, but actually the "philosophy" everyone in the
stats field should follow to deal with real "complicated" stat problems, especially in
industry or when having collaborative projects with industry.

【在 P****D 的大作中提到】
: 对于这个问题,如果回答“引入splines”,对方可能会追问“如何引入?”如果在这
: 方面的基础并不很扎实的,这样被追着打很狼狈。还不如采取主动,自己说,“可以
: transform或加入高阶的term,取决于数据的实际情况。如何transform,也要借用前人
: 的经验、行业里普遍使用的方法、我们本来的hypothesis、还有数据的实际情况。我们
: 可以用图表或简单的descriptive statistics来初步探索y和x的关系,到底是不是线性
: 的。”
: 面试时说废话的技巧很重要!如果不熟悉的领域,想办法推卸掉,尽量自己主动多说,
: 从而把对方追着问的可能给堵上。
:
: splines。

o****o
发帖数: 8077
88
why 显得多不专业?

【在 h***i 的大作中提到】
: 公司不会没事用spline吧,公司爱用linear regression及其变种, spline这种玩意公
: 司如果有人interview 问了显得多不专业。

d******e
发帖数: 7844
89
问大师啊!!!
当然不能问spline了,必须问三分法

【在 o****o 的大作中提到】
: why 显得多不专业?
A*******s
发帖数: 3942
90
second this.
i think splines is the best way to incorporate nonlinearity without much
loss in interpretation.

【在 o****o 的大作中提到】
: why 显得多不专业?
相关主题
提高R速度的一些tips[合集] 关于统计文献检索
请知道Birch's Theorem 的人进来帮帮我最大似然估计和最大后验估计究竟是什么东东?
抛砖引玉:敢问路在何方?请教一个曲面拟合问题
进入Statistics版参与讨论
w*******t
发帖数: 364
91
thanks for sharing!
w****c
发帖数: 514
92
mark
B****n
发帖数: 11290
93

If you said wald, likelihood in this question, you will have big trobule.
These methods are for hypothesis testing; MLE or quasi likelihood estimator
are for estimation of parameters.
they
good

【在 k*****u 的大作中提到】
: 哈 真惭愧啊
: 我记错了。只记得以前学的时候logistic回归有三个办法,刚才翻书,发现是wald,
: likelihood-ratio, scoreing method。我只记得用牛顿拉普森迭代,当时记不清那三
: 个东东,被我说成mle了,太惭愧了。
: 我同学告诉我说他去google面试都是问的概率统计的概念什么的,所以我准备的都是那
: 些东东。结果什么都没问。
: ps,google的phone interview通用么? 前面投了两个google的职位,这是面的一个。
: 还有一个让我给时间说要面试,会不会这个黄了,结果就会传到另一个哪儿去?
:
: discussion with some friends interviewed by google statistical groups, they

t****y
发帖数: 576
94
求dreamer同学的面经。估计超过一年了,版内搜索已经找不到了

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

L****n
发帖数: 3545
95
!!!! niu

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

l******n
发帖数: 9344
96
不错
哪个地方的?Santa monica还是mountain view?

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

c***3
发帖数: 527
97
mark!
B****n
发帖数: 11290
98
有不少問題確實不好回答 其實人家也沒期待你給多完整的答案 就是看你組織反應的能力
也和你統計基本知識有關
當然也和英文有關拉 英文好 一次就很清楚別人在問什麼 一邊聽問題 一邊就可以思考

they
good

【在 h***i 的大作中提到】
: 一个电面,写那么多。。。google就是要反应快,把基本的翻熟就好了
:
: discussion with some friends interviewed by google statistical groups, they
: want an open mind, quick response ppl with a solid stat background and good
: skills in R(?)
: further info), the interviewer already knew your background is very weak…
: Iterative methods.
: , instead of logistic? How to answer? If you can’t answer this question,
: you need to read and think more.
: undergrads..

o*******y
发帖数: 810
99
收藏先

因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
的。记不清了 。
后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
么选order
下一个问题好像是contingency table的问题:
先问我怎么来design看人们喜欢google 地图还是别的地图。我说那就做个survey。然
后她问我怎么处理这个survey数据。比如n个人做了这个实验。这样看上去是
contingency table啊,可是刚才面试的时候我也慌了。我说的是用开方检验。
接着问的是,除了记录他们喜欢那个地图以外,还有什么要记录的?我说的是还有
response time,客户体验,想说的挺多的就是不知道怎么用英语表达出来。
回答的太撮了,英语也说的磕磕绊绊的。然后她问我有没有问题,我问了两问题。结果
她又说还有问题。
下一个问题,这个问题我也没怎么弄明白:
使用chrome,假如有记录从开始到现在people 使用chrome上的搜索引擎的记录,那么
怎么分析这个data,客户是不是更喜欢google?
刚开始我觉得这个问题跟google地图那个一样。她说不一样,这个是有各个时间的记录
。我说这不就是时间序列么?然后问了我一些时间序列的东西。
还是这个问题,能不能做回归?y是记录值,x是时间。 我说我觉得不可以。大牛来说
说这种数据该怎么分析?
回答的挺不好的。感觉除了统计的一些知识外,还要考虑怎么设计实验。基本上给的问
题都是我们想检验某个结果,你怎么去设计实验,怎么收集data,怎么分析?
算是给后来者留点经验吧。

【在 k*****u 的大作中提到】
: 确实是这样啊。
: 我说用多项式回归,然后考虑怎么选择order。结果立刻就被追问怎么选择。

z**********i
发帖数: 12276
100
牛人都来这里跟帖拉,我也借着提高一下。哈哈。

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

相关主题
logistic regression用LASSO选择变量合适吗?SVM (R)的结果能转成scorecard吗?
how do you deal with sparse data?SAS Logistic Regression算出来的Estimated Probability of Default太小
any one did EM to find MLE of mixed effects model in R[合集] question about MLE
进入Statistics版参与讨论
Z******a
发帖数: 1178
101
装逼的人太多了,妈的逼。
logistic regression不是maximize likelihood解法是什么?麻痹的人家答MLE怎么就
weak了?
莫装逼,装逼被雷劈!日!
h********y
发帖数: 540
102
学习了
s******t
发帖数: 71
103
有谁能分享下dreamer的面经吗 已然搜不到 了
g*****o
发帖数: 812
104
一看是12年的帖子被翻出来..

【在 h********y 的大作中提到】
: 学习了
r*****d
发帖数: 346
105
敢情就是面演技啊。。
d******e
发帖数: 7844
106
你可能觉得记得IRLS说明你记忆力好。
但你可知道IRLS不过是Newton Raphson在解Logistic Regression上的应用罢了... ...

【在 h***i 的大作中提到】
: 同学,logistic regression 的估计是用IRLS
: 这么经典的glm的fitting 的algorithm不记得只能怪你功课没做好了

d******e
发帖数: 7844
107
哈哈

【在 g*****o 的大作中提到】
: 一看是12年的帖子被翻出来..
d******e
发帖数: 7844
108
解logistic regression就是在做MLE。
但是estimate背后的generalized linear model,MLE只是其中一个方法。

【在 Z******a 的大作中提到】
: 装逼的人太多了,妈的逼。
: logistic regression不是maximize likelihood解法是什么?麻痹的人家答MLE怎么就
: weak了?
: 莫装逼,装逼被雷劈!日!

m******s
发帖数: 1469
109
Zan

【在 k*****u 的大作中提到】
: 看了dreamer同学的面经,发现跟我的不一样啊不一样。
: 因为給我打电话的人英语有些听不懂,所以问题可能写得不精确。
: 上来就问什么是logistic回归。解释了一遍。然后问怎么做参数估计.印象当中有3种方
: 法,可是及不出来。只好说MLE,score method什么的。 然后问我说MLE又怎么做,我
: 记得好像用拉格让日乘子什么的,拉格朗日还不知道英文怎么说。还有New-Rapson什么
: 的。记不清了 。
: 后面一个问题是,如果logistic回归自变量x不是线性的,怎么办?这个问题我也不知
: 道。只好说那就用多项式回归,然后问我说多项式回归有什么risk?还有多项式回归怎
: 么选order
: 下一个问题好像是contingency table的问题:

r*****t
发帖数: 74
110
时间可以做回归,或者可以做HLM,called growth model。
突然觉得我这个学文的人统计不是那么差了。有信心找统计工作了!
1 (共1页)
进入Statistics版参与讨论
相关主题
抛砖引玉:敢问路在何方?SAS Logistic Regression算出来的Estimated Probability of Default太小
[合集] 关于统计文献检索[合集] question about MLE
最大似然估计和最大后验估计究竟是什么东东?[新手求救]怎样输出logistic regression的结果?
请教一个曲面拟合问题Logistics forecasting 前景如何? (转载)
logistic regression用LASSO选择变量合适吗?保险公司technical interview 会怎么问?
how do you deal with sparse data?面了一个IT公司跟机器学习相关的职位
any one did EM to find MLE of mixed effects model in RSAS问题,关于@和@@的区别
SVM (R)的结果能转成scorecard吗?请教Base 70 中的一题 关于@
相关话题的讨论汇总
话题: mle话题: logistic话题: google