由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - data science 面试求教
相关主题
刚入行新人的两个问题机器学习需要自己搞算法吗
紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!random forest 有没有可能保证某几个变量一直被选上
random forest/xgbclassifier的feature importance请问哪些算法是可以用python写的,然后输入PMML
Data scientist / Machine Learning Engineer 相关面试题 (转载)请教大家一个做feature的问题
如何证明某个feature 没用, 分组的分布和 总体分布相同问题:用VIF做feature selection
问一个 feature 相关性问题凑热闹转发一篇自己写的博文,轻拍
大家对于有很多value的categorical feature都怎么处理?用R做review 的summary
Data scientist / Machine Learning Engineer 相关面试题 (转载)One phone interview question.
相关话题的讨论汇总
话题: feature话题: 数据话题: 房价话题: science话题: 类型
进入DataSciences版参与讨论
1 (共1页)
m*******4
发帖数: 34
1
本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
聊的实验室项目, 他们挺感兴趣。
我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
发了个 data science challenge.
预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
置, 距离城里多远,有数字类型的, 也有categorical 的。
然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
要求一周内做出来,
提交代码。描述模型, 选的什么软件, 什么包
何种算法, 怎样选feature, 为什么
怎样分析模型的 accuracy , 用什么方法,为什么选这个方法
那个feature 影响高, 那个影响低, 用什么方法找的。
数据有错误, 要求清洗, 哪些清洗时必要的
---------------------------------
我们实验室就是用用 naive bayes, SVM 啥的。 没人真懂。
我觉得这是回归不是分类。 我上统计课的时候知道些线性回归的皮毛。
觉得此题对版上的人来说是小菜一碟, 特来讨教
Y****a
发帖数: 243
2
听起来这个数据已经相对clean了,如果要的结果是房价区间,可以做分类,如果要具
体数值,就regression。最简单的就是把数据扔各种tree model里,用cross
validation找个好的。randomforest可以给你variable importance。
话说回来,这个面试题不会,真工作了,怎么做啊? 你还是强调一下你感兴趣的是sde
吧。
1 (共1页)
进入DataSciences版参与讨论
相关主题
One phone interview question.如何证明某个feature 没用, 分组的分布和 总体分布相同
请问关于小的dataset evaluation的问题问一个 feature 相关性问题
MATLAB 高手请进: 用 crossvalidation 建 model之后还能用 kfoldpredict 吗?大家对于有很多value的categorical feature都怎么处理?
恭喜开版,发个刚看到的好玩的machine learning的图Data scientist / Machine Learning Engineer 相关面试题 (转载)
刚入行新人的两个问题机器学习需要自己搞算法吗
紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!random forest 有没有可能保证某几个变量一直被选上
random forest/xgbclassifier的feature importance请问哪些算法是可以用python写的,然后输入PMML
Data scientist / Machine Learning Engineer 相关面试题 (转载)请教大家一个做feature的问题
相关话题的讨论汇总
话题: feature话题: 数据话题: 房价话题: science话题: 类型