由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - Re: 攒人品,发Google Statistician/Data Scientist电面面经
相关主题
请问想找data scientist 工作应该怎么开始准备lending club的notes 数据
问个R的问题retail bussiness预测客户的流失概率
大家对于有很多value的categorical feature都怎么处理?问题:用VIF做feature selection
data challenge ... 现在公司都咋tmd想的[IT+IEOR背景]请教一下往DtSci方向的职业发展建议
报面筋求实习合租 (转载)Fresh Grad求助:该不该接这个contractor (转载)
评价一个变量可预测性问题 (转载)Some thoughts on data science and data scientists
如何用python读取大数据内推Google - Data Scientist & Quantitative Analyst
model selection problem下周面A和L的data scientist and data engineer. 有没有面经?一般问些啥?
相关话题的讨论汇总
话题: data话题: google话题: scientist话题: regression
进入DataSciences版参与讨论
1 (共1页)
m********t
发帖数: 94
1
【 以下文字转载自 Statistics 讨论区 】
发信人: management (management), 信区: Statistics
标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
regression 怎么check model是啥意思
log reg跟其他的classification最大的不同还是他有概率结果吧
t-test问了大概什么问题
numerical跟categorical怎么表示真的不知道 这算data visualization吧
但是numerical化01 最简单的方式是bucketization吧
除此之外 还有什么方法?
已经悲剧了,为接下来找工作攒人品吧,希望快快有offer。
recruiter强调说让复习以前学的基础知识,probability,t test和regression之类的
。也听人说G家统计方向的职位都是问很基础的统计知识,但是我被问了time series的
东西,都有哪些models,怎么比较这些models?还问了experimental design的问题,
如果variables有numerical和categorical的,怎么在X和Y轴表示出来。还有logistic
regression的题目,怎么check model,logistic regression和其他的classification
methods有何不同。
m********a
发帖数: 128
2
好难啊~~

【在 m********t 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: management (management), 信区: Statistics
: 标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
: 发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
: regression 怎么check model是啥意思
: log reg跟其他的classification最大的不同还是他有概率结果吧
: t-test问了大概什么问题
: numerical跟categorical怎么表示真的不知道 这算data visualization吧
: 但是numerical化01 最简单的方式是bucketization吧
: 除此之外 还有什么方法?

m******a
发帖数: 77
3
曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
Prediction 对 Actual 的散点图就够了

【在 m********t 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: management (management), 信区: Statistics
: 标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
: 发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
: regression 怎么check model是啥意思
: log reg跟其他的classification最大的不同还是他有概率结果吧
: t-test问了大概什么问题
: numerical跟categorical怎么表示真的不知道 这算data visualization吧
: 但是numerical化01 最简单的方式是bucketization吧
: 除此之外 还有什么方法?

c***z
发帖数: 6348
4
exactly :)

【在 m******a 的大作中提到】
: 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
: Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
: regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
: 记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
: Prediction 对 Actual 的散点图就够了

P*****6
发帖数: 273
5
check model, 为什么不可以是cross validation?

【在 m******a 的大作中提到】
: 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
: Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
: regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
: 记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
: Prediction 对 Actual 的散点图就够了

j******4
发帖数: 6090
6
cross validation不就是不断的prediction然后跟actual比较么

【在 P*****6 的大作中提到】
: check model, 为什么不可以是cross validation?
m******a
发帖数: 77
7
check model 应该是模型作出来后,先简单地看一下
1. 模型是否有问题 - 如某些地方预测得好, 某些地方预测得不好, 而预测得不好的地
方可能正是自己关心的, 要求保证精确的地方
2. 模型performance是否达到或接近期望的精度, 如果差的太远,可能就回去想别的办
法了
cross validation 应该是下一步的事, 模型没问题, 精度也符合预期, 这时就要考虑
模型的稳定性, 首先是对不同 Sample 的稳定性, 然后是对时间等等跨度的稳定
当然, 如果时间允许, 你也可以任何情况下都来一个cross validation, 但在公司里,
很少有人会让你这么干

【在 P*****6 的大作中提到】
: check model, 为什么不可以是cross validation?
1 (共1页)
进入DataSciences版参与讨论
相关主题
下周面A和L的data scientist and data engineer. 有没有面经?一般问些啥?报面筋求实习合租 (转载)
F家DS,analytics电面面经,贡献一个sql相关 (转载)评价一个变量可预测性问题 (转载)
求 zillow data scientist 面经如何用python读取大数据
Any 面经 for Workday Data Scientist?model selection problem
请问想找data scientist 工作应该怎么开始准备lending club的notes 数据
问个R的问题retail bussiness预测客户的流失概率
大家对于有很多value的categorical feature都怎么处理?问题:用VIF做feature selection
data challenge ... 现在公司都咋tmd想的[IT+IEOR背景]请教一下往DtSci方向的职业发展建议
相关话题的讨论汇总
话题: data话题: google话题: scientist话题: regression