由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - Yelp onsite面经
相关主题
EE 转CS面经apple phone 面经
[面经]YELP家不刷题的惨烈后果twitter和Netflix的电话面经
YELP 面经Bloomberg电面面经
发Facebook intern面经面经&感想
Apple 数据科学家面经发个Qualcomm的onsite的面经吧
我也来报个amazon phone interview的面经吧分享总结的G家统计面经
amazon 电面面经Yelp面经
网络公司面经,求祝福新鲜出炉的Yelp面经[已更新]
相关话题的讨论汇总
话题: ad话题: click话题: powerset话题: yelp话题: mysql
进入JobHunting版参与讨论
1 (共1页)
s*******e
发帖数: 1630
1
可能忘掉一些题,单说我还记得的吧:
(1)powerset and permutation
(2)mapreduce计算click-through rate
(3)按层print树(带indent,非binary),输入是只有父节点的node list
(4)Top k urls in a string stream
(5)Mysql怎么解决deadlock问题
已悲剧,估计是挂在(5)了,我说我用mysql熟,但对deadlock解决不熟悉,他还穷追不
舍,要我当场想,我想了说timeout吧,他说对,但还有其他方法吗,一定要我想三四
个不同方法,然后就stuck在那了,也不move on到下一个问题,晕死
g********r
发帖数: 58
2
楼主面的是DATA Mining 组吧?
r**h
发帖数: 1288
3
我感觉他们家很看重culture fit,题目和别人相比倒都不算难

【在 s*******e 的大作中提到】
: 可能忘掉一些题,单说我还记得的吧:
: (1)powerset and permutation
: (2)mapreduce计算click-through rate
: (3)按层print树(带indent,非binary),输入是只有父节点的node list
: (4)Top k urls in a string stream
: (5)Mysql怎么解决deadlock问题
: 已悲剧,估计是挂在(5)了,我说我用mysql熟,但对deadlock解决不熟悉,他还穷追不
: 舍,要我当场想,我想了说timeout吧,他说对,但还有其他方法吗,一定要我想三四
: 个不同方法,然后就stuck在那了,也不move on到下一个问题,晕死

h***t
发帖数: 2540
4
how to do (2) ? (4) use heap ?
c********p
发帖数: 1969
5
mark
c********p
发帖数: 1969
6
什么是powerset
u*****o
发帖数: 1224
7
我觉得都是难题,LZ已经答的很好了。。。
按层print树(带indent,非binary),输入是只有父节点的node list
这个题什么意思啊,是LEETCODE原题吗?或者给个例子帮着理解一下?
p*****2
发帖数: 21240
8
不错了。还有onsite。
J****3
发帖数: 427
9
神马是click-through rate 啊?
s*******e
发帖数: 1630
10
不知道是不是原题,可能我还没做到,就是每个节点有一个parent,然后要按从上到下
有格式的输出整个树(其实是forest)例如:
1
- 2
- 3
- 4
- 5
6

【在 u*****o 的大作中提到】
: 我觉得都是难题,LZ已经答的很好了。。。
: 按层print树(带indent,非binary),输入是只有父节点的node list
: 这个题什么意思啊,是LEETCODE原题吗?或者给个例子帮着理解一下?

相关主题
我也来报个amazon phone interview的面经吧apple phone 面经
amazon 电面面经twitter和Netflix的电话面经
网络公司面经,求祝福Bloomberg电面面经
进入JobHunting版参与讨论
s*******e
发帖数: 1630
11
(2)的话输入是user_id, should_show_ad(T/F), show_ad (T/F), ad_id, click_ad (T
/F)
Click through rate就是在show_ad=T的时候click_ad=T的比例,用mapreduce做,算是
design题,但要coding写mapper reducer

【在 h***t 的大作中提到】
: how to do (2) ? (4) use heap ?
h***t
发帖数: 2540
12
so you count freq of show_ad and should_show_ad when they are true?
It is then quite straightforward.

(T

【在 s*******e 的大作中提到】
: (2)的话输入是user_id, should_show_ad(T/F), show_ad (T/F), ad_id, click_ad (T
: /F)
: Click through rate就是在show_ad=T的时候click_ad=T的比例,用mapreduce做,算是
: design题,但要coding写mapper reducer

r**h
发帖数: 1288
13
嗯,我觉得考点之一就是看你懂不懂得CTR

【在 h***t 的大作中提到】
: so you count freq of show_ad and should_show_ad when they are true?
: It is then quite straightforward.
:
: (T

h***t
发帖数: 2540
14
seriously, (4) is the topic of a paper in VLDB a few years ago if my memory
is correct, any shortcut?

【在 r**h 的大作中提到】
: 嗯,我觉得考点之一就是看你懂不懂得CTR
s*******e
发帖数: 1630
15
差不多这么一回事吧,关键是开始没有给很清晰的定义,所以觉得也考communication
,把定义弄好了那么就考虑把false的情况在mapper这一步就扔掉,其他不相关的
attribute也扔掉,不然给cloud做的时候很贵

【在 r**h 的大作中提到】
: 嗯,我觉得考点之一就是看你懂不懂得CTR
h***t
发帖数: 2540
16
How you did (4)? I am curious

communication

【在 s*******e 的大作中提到】
: 差不多这么一回事吧,关键是开始没有给很清晰的定义,所以觉得也考communication
: ,把定义弄好了那么就考虑把false的情况在mapper这一步就扔掉,其他不相关的
: attribute也扔掉,不然给cloud做的时候很贵

A***o
发帖数: 358
17
lossy counting and sticky sampling

memory

【在 h***t 的大作中提到】
: seriously, (4) is the topic of a paper in VLDB a few years ago if my memory
: is correct, any shortcut?

h****p
发帖数: 87
18
mark
z*********8
发帖数: 2070
19
谁能贴一下大概的代码?

(T

【在 s*******e 的大作中提到】
: (2)的话输入是user_id, should_show_ad(T/F), show_ad (T/F), ad_id, click_ad (T
: /F)
: Click through rate就是在show_ad=T的时候click_ad=T的比例,用mapreduce做,算是
: design题,但要coding写mapper reducer

1 (共1页)
进入JobHunting版参与讨论
相关主题
新鲜出炉的Yelp面经[已更新]Apple 数据科学家面经
Yelp 面经我也来报个amazon phone interview的面经吧
Yelp电面面经+求问amazon 电面面经
我也来贡献一个yelp面经吧网络公司面经,求祝福
EE 转CS面经apple phone 面经
[面经]YELP家不刷题的惨烈后果twitter和Netflix的电话面经
YELP 面经Bloomberg电面面经
发Facebook intern面经面经&感想
相关话题的讨论汇总
话题: ad话题: click话题: powerset话题: yelp话题: mysql