m********t 发帖数: 94 | 1 【 以下文字转载自 Statistics 讨论区 】
发信人: management (management), 信区: Statistics
标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
regression 怎么check model是啥意思
log reg跟其他的classification最大的不同还是他有概率结果吧
t-test问了大概什么问题
numerical跟categorical怎么表示真的不知道 这算data visualization吧
但是numerical化01 最简单的方式是bucketization吧
除此之外 还有什么方法?
已经悲剧了,为接下来找工作攒人品吧,希望快快有offer。
recruiter强调说让复习以前学的基础知识,probability,t test和regression之类的
。也听人说G家统计方向的职位都是问很基础的统计知识,但是我被问了time series的
东西,都有哪些models,怎么比较这些models?还问了experimental design的问题,
如果variables有numerical和categorical的,怎么在X和Y轴表示出来。还有logistic
regression的题目,怎么check model,logistic regression和其他的classification
methods有何不同。 | m********a 发帖数: 128 | 2 好难啊~~
【在 m********t 的大作中提到】 : 【 以下文字转载自 Statistics 讨论区 】 : 发信人: management (management), 信区: Statistics : 标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经 : 发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东) : regression 怎么check model是啥意思 : log reg跟其他的classification最大的不同还是他有概率结果吧 : t-test问了大概什么问题 : numerical跟categorical怎么表示真的不知道 这算data visualization吧 : 但是numerical化01 最简单的方式是bucketization吧 : 除此之外 还有什么方法?
| m******a 发帖数: 77 | 3 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
Prediction 对 Actual 的散点图就够了
【在 m********t 的大作中提到】 : 【 以下文字转载自 Statistics 讨论区 】 : 发信人: management (management), 信区: Statistics : 标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经 : 发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东) : regression 怎么check model是啥意思 : log reg跟其他的classification最大的不同还是他有概率结果吧 : t-test问了大概什么问题 : numerical跟categorical怎么表示真的不知道 这算data visualization吧 : 但是numerical化01 最简单的方式是bucketization吧 : 除此之外 还有什么方法?
| c***z 发帖数: 6348 | 4 exactly :)
【在 m******a 的大作中提到】 : 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟 : Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。 : regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就 : 记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下 : Prediction 对 Actual 的散点图就够了
| P*****6 发帖数: 273 | 5 check model, 为什么不可以是cross validation?
【在 m******a 的大作中提到】 : 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟 : Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。 : regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就 : 记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下 : Prediction 对 Actual 的散点图就够了
| j******4 发帖数: 6090 | 6 cross validation不就是不断的prediction然后跟actual比较么
【在 P*****6 的大作中提到】 : check model, 为什么不可以是cross validation?
| m******a 发帖数: 77 | 7 check model 应该是模型作出来后,先简单地看一下
1. 模型是否有问题 - 如某些地方预测得好, 某些地方预测得不好, 而预测得不好的地
方可能正是自己关心的, 要求保证精确的地方
2. 模型performance是否达到或接近期望的精度, 如果差的太远,可能就回去想别的办
法了
cross validation 应该是下一步的事, 模型没问题, 精度也符合预期, 这时就要考虑
模型的稳定性, 首先是对不同 Sample 的稳定性, 然后是对时间等等跨度的稳定
当然, 如果时间允许, 你也可以任何情况下都来一个cross validation, 但在公司里,
很少有人会让你这么干
【在 P*****6 的大作中提到】 : check model, 为什么不可以是cross validation?
|
|