由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - data science 面试求教
相关主题
找工作总结 [下]电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧
【大包子】Factor data analysis抓狂!为啥选出来的predictor都这么差
model的predictors之间有multi-colinearity怎么办?请问:想fit gamma 并同时用lasso的方法做variable selection
good classification methods for high dimension data关于lasso的variable selection问题
Principal Components Analysis 中 factor 选择的问题Gene expression =?= Variable selection
有没有大牛来classifiy一下 PCA用法吗? (转载)logistic regression结果释疑,解读
machine learning救助 模型在1数据集上表现好 其他烂用LASSO选变量后重新fit regression有什么弊端?
关于stepwise programming一道面试题,向本版求教一下。
相关话题的讨论汇总
话题: feature话题: science话题: 类型话题: data话题: 面试
进入Statistics版参与讨论
1 (共1页)
m*******4
发帖数: 34
1
本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
聊的实验室项目, 他们挺感兴趣。
我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
发了个 data science challenge.
预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
置, 距离城里多远,有数字类型的, 也有categorical 的。
然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
要求一周内做出来,
提交代码。描述模型, 选的什么软件, 什么包
何种算法, 怎样选feature, 为什么
怎样分析模型的 accuracy , 用什么方法,为什么选这个方法
那个feature 影响高, 那个影响低, 用什么方法找的。
数据有错误, 要求清洗, 哪些清洗时必要的
---------------------------------
我们实验室就是用用 naive bayes, SVM 啥的。 没人真懂。
我觉得这是回归不是分类。 我上统计课的时候知道些线性回归的皮毛。
觉得此题对版上的人来说是小菜一碟, 特来讨教
S******y
发帖数: 1123
2
please check your inbox
欢迎浏览Python/R/Hadoop实战速成课网页-
http://plus.google.com/+statsGuyMITBBS/about
z**********e
发帖数: 91
3
回归?Lasso Ridge?这是最直接的想法。。
选feature看有没有multicollinearity,stepwise或者PCA(extraction)?
复杂点可以考虑regression tree,SVR甚至Bayesian regression什么的。。
我也就是把统计课上学的东西可能相关的大概列了一列。。。
1 (共1页)
进入Statistics版参与讨论
相关主题
一道面试题,向本版求教一下。Principal Components Analysis 中 factor 选择的问题
请教一个multi colinearity的问题有没有大牛来classifiy一下 PCA用法吗? (转载)
有80个候选Predictors,怎么从中选<10个machine learning救助 模型在1数据集上表现好 其他烂
请教: 3组数据之间的correlation??关于stepwise programming
找工作总结 [下]电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧
【大包子】Factor data analysis抓狂!为啥选出来的predictor都这么差
model的predictors之间有multi-colinearity怎么办?请问:想fit gamma 并同时用lasso的方法做variable selection
good classification methods for high dimension data关于lasso的variable selection问题
相关话题的讨论汇总
话题: feature话题: science话题: 类型话题: data话题: 面试