由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 技术电面感受&请教
相关主题
急,xgboost prediction的问题data challenge ... 现在公司都咋tmd想的
我觉得neural network应用范围不大啊一个经常会用到的问题,和推荐算法有点关系。想不到有什么直接简单的方法。
DS是不是需要数学基础很强怎样实现 relational database,选 subset
谁能推荐几本DS的书?请教几个问题
spark 问题Role mining
怎么表达kernel density estimationScience杂志一篇关于clustering的新文章 (转载)
如何理解 curse of dimensionalityBayesian inference
大家对于有很多value的categorical feature都怎么处理?datascientist几个基本问题
相关话题的讨论汇总
话题: rf话题: feature话题: 面试官话题: 算法话题: 感觉
进入DataSciences版参与讨论
1 (共1页)
g****u
发帖数: 25
1
骑驴找马今天面了一个感觉牛逼哄哄的startup, 已挂,满满的挫败感。最大的感受是
平时做项目的时候machine learning的算法都是抓来用用,那个好用用哪个,但对算法
的理解都很肤浅,没有深入思考过。大牛们看看下面几个问题怎么回答才好?
1)第一个问题是我有一个项目用mape来evaluate模型,面试官问我为什么不能用rmse
,我说mape是客户要求的,所以我就没多想,我实在不好意思讲我当时瞎扯了点啥,
太打脸了
2)面试官问我favorite的算法是什么,我说没有,平时logistic regression和random
forest用的比较多,然后面试官就问我什么时候用lg什么时候用rf。虽然我理论上知
道一点各自的特点比如lg对outlier比较敏感,模型interpretability比较高, rf是non
-parametric的所以对outlier不敏感,不用担心colinearity的问题之类的,但用到具
体问题的时候,我就说不上来了,因为其实我是抓来都用用,如果两个算法
performance差的比较大,我就直接用好的那个。我临时就凭感觉说如果feature space
比较sparse的话rf一般不好,因为sparse feature很多0,然后RF做split的时候不能做
有效的区分,我们希望rf的feature是reasonably diversed。。。感觉自己也太能扯淡了
。。。
3)然后面试官接着问我用rf的时候参数都是怎么调的,我就抓瞎了,其实我做过的严
肃认真的项目都是用lg或svm的,rf还真没认真调过参数,我说我一般调number of
trees和feature subset的大小,feature subset我知道一般是feature dim的平方根,
然后number of trees我就做个grid search看看多少个tree最好,面试官又问是不是
tree越多越好,我说一般是的,但improvements会越来越小,时间越来越多,一般差不
多我就停了。感觉面试官很不满意,大牛们调number of trees有什么可以作为依据吗?
还有一些杂七杂八的小问题我就不罗嗦了,其实一面完我就知道没戏了,因为面试官最
后只说了thanks for your time,后面会怎样连提都没提,哭。。。。现在对career好
迷茫,感觉项目也做了不少,但技术并没有进步,在一个小破公司算是技术lead,没人
会question我,但这样就没有动力提高自己,做项目其实大部分时间都在清理数据,建
feature matrix上面,最后建模那一步反而是最轻松愉快的,算法也没认真研究过。。
。感觉这样继续混日子也不是办法,想换工作,leetcode也刷了200多道,但感觉这种
编程算法在实际工作中根本用不到啊,最近也开始刷统计,但面试的时候又发现其实还
是要有实际经验的积累,照本宣科好像也不管什么用,大牛们,请问我这种情况怎么办
才好呢?跪谢!!!
M********0
发帖数: 1230
2
给楼主的建议就是干什么事都要精 要注重细节 尤其是搞技术的 “糙快猛”可能短
期有效果 长期总是不行的
想必你leetcode刷了200多道题也是code过了OJ test就换下一题做 不会考虑算法细节
不会一题多解吧
现在塞给你几本书告诉你把这些书复习好了应付面试就没问题 估计最后也会因为种种
细节fail掉面试
需要改变的首先是态度 有了正确的态度 再去学习/复习那些Stats/ML的知识 准备面
试 自然效果就会完全不同
当然如果碰到很水的面试官/面试题 也还是有可能过的 但那种公司/人 和你现在的
公司估计也没啥区别了
g****u
发帖数: 25
3
Marcus2010,非常感谢你的建议!你说的太对了!我这几天反思了一下,也觉得是我的
态度问题,太浮躁了,真的是像你说的干什么都要精,才能有长远的发展,我一想到如
果再过一年或几年我还是这个水平就觉得不能忍,要从现在开始努力了,感谢大神!
m******r
发帖数: 1033
4
那你塞给我几本书。 我就是不求甚解的。 也不想成为大牛,就想成为快糙猛类型的,
混饭吃就行,反正技术难题有你们大牛罩着 干嘛费那个劲。 请问有解么?



【在 M********0 的大作中提到】
: 给楼主的建议就是干什么事都要精 要注重细节 尤其是搞技术的 “糙快猛”可能短
: 期有效果 长期总是不行的
: 想必你leetcode刷了200多道题也是code过了OJ test就换下一题做 不会考虑算法细节
: 不会一题多解吧
: 现在塞给你几本书告诉你把这些书复习好了应付面试就没问题 估计最后也会因为种种
: 细节fail掉面试
: 需要改变的首先是态度 有了正确的态度 再去学习/复习那些Stats/ML的知识 准备面
: 试 自然效果就会完全不同
: 当然如果碰到很水的面试官/面试题 也还是有可能过的 但那种公司/人 和你现在的
: 公司估计也没啥区别了

t*****t
发帖数: 285
5
其实我觉得还是针对面试的准备不足,这把跪了下一次把这几种办法的具体应用想通不
就好了,看看教程啥的。
工作中,还真是哪个nb上哪个,我只见过及其个别的人能够提前判断而且准确的。现在
计算资源这么便宜。
g****u
发帖数: 25
6

tminuit谢谢你,你这么一说我感觉好受了很多,原来大家都是那个nb上哪个呀哈哈哈:
)

【在 t*****t 的大作中提到】
: 其实我觉得还是针对面试的准备不足,这把跪了下一次把这几种办法的具体应用想通不
: 就好了,看看教程啥的。
: 工作中,还真是哪个nb上哪个,我只见过及其个别的人能够提前判断而且准确的。现在
: 计算资源这么便宜。

g****u
发帖数: 25
7
Update一下,我居然不可思议的拿到onsite了哈哈哈哈哈哈!让我仰天长啸一下!本来
想把这个帖子删了但看到有大牛们回复我就来update一下~
后来hr发邮件说有时间chat一下吗,我知道这公司好像有打电话给feedback的习惯,而
且如果能进下一轮的话不直接发邮件定时间就行了吗,所以就很沉重的说当然可以(内
心os: 虽然我不想但还是要直面惨痛的现实。。。)
然后hr就问我感觉怎么样,我很老实的说I feel I did not do a great job。。。然
后hr很惊讶的说是吗,我听到的feedback正好是opposite,说went very well,邀请你
来onsite! 哈哈哈哈哈,我大写的懵逼!彻底体验了一把什么叫峰回路转:)
剩下的时间要好好准备onsite了,感觉未来又充满希望!:)
l******n
发帖数: 9344
8
看来面试官也是草蜢快路子的,听了你的答案深以为然。。。

【在 g****u 的大作中提到】
: Update一下,我居然不可思议的拿到onsite了哈哈哈哈哈哈!让我仰天长啸一下!本来
: 想把这个帖子删了但看到有大牛们回复我就来update一下~
: 后来hr发邮件说有时间chat一下吗,我知道这公司好像有打电话给feedback的习惯,而
: 且如果能进下一轮的话不直接发邮件定时间就行了吗,所以就很沉重的说当然可以(内
: 心os: 虽然我不想但还是要直面惨痛的现实。。。)
: 然后hr就问我感觉怎么样,我很老实的说I feel I did not do a great job。。。然
: 后hr很惊讶的说是吗,我听到的feedback正好是opposite,说went very well,邀请你
: 来onsite! 哈哈哈哈哈,我大写的懵逼!彻底体验了一把什么叫峰回路转:)
: 剩下的时间要好好准备onsite了,感觉未来又充满希望!:)

x******g
发帖数: 109
9
祝你onsite顺利! 谢谢你的经验分享!

【在 g****u 的大作中提到】
: Update一下,我居然不可思议的拿到onsite了哈哈哈哈哈哈!让我仰天长啸一下!本来
: 想把这个帖子删了但看到有大牛们回复我就来update一下~
: 后来hr发邮件说有时间chat一下吗,我知道这公司好像有打电话给feedback的习惯,而
: 且如果能进下一轮的话不直接发邮件定时间就行了吗,所以就很沉重的说当然可以(内
: 心os: 虽然我不想但还是要直面惨痛的现实。。。)
: 然后hr就问我感觉怎么样,我很老实的说I feel I did not do a great job。。。然
: 后hr很惊讶的说是吗,我听到的feedback正好是opposite,说went very well,邀请你
: 来onsite! 哈哈哈哈哈,我大写的懵逼!彻底体验了一把什么叫峰回路转:)
: 剩下的时间要好好准备onsite了,感觉未来又充满希望!:)

f*******6
发帖数: 56
10
刚修完data mining的斗胆说说自己的看法:
做项目的时候,就会发现同样一个dataset,用不同的方法结果PERFORMANCE明显不同,
这个时候就会去思考为什么这个方法针对这个dataset会表现非常好,另外一个不适用。
rf最大的好处是对FEATURE进行training, 同时可以对instance进行training. 是
ensemble其中之一大用法。
老师上课说的最多的是会使用算法,算是高中生都能做,但是针对什么DATASET使用什
么方法,如何避免pitfalls是最重要的,学过与否的区别就在于你会尽量避免产生
misleading results.
现在weka,rapidminer都用工具可以用,但是要知道深层次的算法怎么来的确实需要深
入地学习。
1 (共1页)
进入DataSciences版参与讨论
相关主题
datascientist几个基本问题spark 问题
ask for help for R programming (转载)怎么表达kernel density estimation
建模过程中对于outlier的处理问题如何理解 curse of dimensionality
R describe dataset大家对于有很多value的categorical feature都怎么处理?
急,xgboost prediction的问题data challenge ... 现在公司都咋tmd想的
我觉得neural network应用范围不大啊一个经常会用到的问题,和推荐算法有点关系。想不到有什么直接简单的方法。
DS是不是需要数学基础很强怎样实现 relational database,选 subset
谁能推荐几本DS的书?请教几个问题
相关话题的讨论汇总
话题: rf话题: feature话题: 面试官话题: 算法话题: 感觉