h****y 发帖数: 33 | 1 【 以下文字转载自 DataSciences 讨论区 】
发信人: heyley (heyley), 信区: DataSciences
标 题: 新出炉的FB面经
发信站: BBS 未名空间站 (Tue Jan 6 20:18:22 2015, 美东)
已挂。感觉跟预想的非常不一样。概率、统计的根本没问。因为面试官开始连不上网,
所以直接考business sense的题,之后进行到数据分析时时间已经不太够了。
1. business sense:
There are two types of cars A and B. The number of people in US who use A
and B are the same. They drive the same distances each month.
Now there are two new technologies, X and Y (of equal cost).
If apply X, mpg of A would increase from 50 mpg to 75 mpg;
If apply Y, mpg of B would increase from 10 mpg to 11 mpg.
The goal is to decrease the dependence on foreign oil, or to decrease the
consumption of gasoline.
Question: which technology would you apply?
Follow up question: after applying the technology of your choice, assume
there's money available for research on new technology, which car would you
choose to conduct research on?
2. data question:
dialoglog
(userid int
appid int
type char , a flag either "imp" or "click"
ds timestamp
)
How would you access the quality of app?
How to compute click-through rate (in mySQL)?
还是SQL不太熟练。跟对方交流起来没什么问题,但感觉思路跟面试官对不上。
先去角落里默默悲伤一阵。。。 |
h***i 发帖数: 3844 | 2 apply y
research on b
这考啥business了?
【在 h****y 的大作中提到】 : 【 以下文字转载自 DataSciences 讨论区 】 : 发信人: heyley (heyley), 信区: DataSciences : 标 题: 新出炉的FB面经 : 发信站: BBS 未名空间站 (Tue Jan 6 20:18:22 2015, 美东) : 已挂。感觉跟预想的非常不一样。概率、统计的根本没问。因为面试官开始连不上网, : 所以直接考business sense的题,之后进行到数据分析时时间已经不太够了。 : 1. business sense: : There are two types of cars A and B. The number of people in US who use A : and B are the same. They drive the same distances each month. : Now there are two new technologies, X and Y (of equal cost).
|
h****y 发帖数: 33 | 3 面试官自己说的,since I cannot connect to internet, let's start with the
business sense problem.
apply y和research on b是同一个原因吗?
【在 h***i 的大作中提到】 : apply y : research on b : 这考啥business了?
|
h***i 发帖数: 3844 | 4 apply y是简单算算
research on b 是我觉得b 比a 可能性大
【在 h****y 的大作中提到】 : 面试官自己说的,since I cannot connect to internet, let's start with the : business sense problem. : apply y和research on b是同一个原因吗?
|
E*******s 发帖数: 994 | 5 why not research on A?
Car A seems to have more potential given its high MPG?
【在 h***i 的大作中提到】 : apply y是简单算算 : research on b 是我觉得b 比a 可能性大
|
w**p 发帖数: 4080 | 6 A mpg已经很高了,再提升没啥意义.
而B是个油耗子,显然apply y,research on b没啥问题
第二题,很简单的sql题啊. |
c********h 发帖数: 330 | 7 假设A,B的使用人数都是N, 每个月开的mile都是D
那么,X和Y分别需要的汽油量就是:
X = D * N / 75 + D * N / 10
Y = D * N / 50 + D * N / 11
这样算一下的话,X > Y,不过差的很少
但如果apply X的话,会不会导致更多人使用A呢?反而使得总量下降的更多?
觉得这些以及followup都可以跟面试官讨论。人家可能是看你的思路。 |
h***i 发帖数: 3844 | 8 这两种车不是一种类型 一个是八缸 一个是电车 估计是这个意思
【在 c********h 的大作中提到】 : 假设A,B的使用人数都是N, 每个月开的mile都是D : 那么,X和Y分别需要的汽油量就是: : X = D * N / 75 + D * N / 10 : Y = D * N / 50 + D * N / 11 : 这样算一下的话,X > Y,不过差的很少 : 但如果apply X的话,会不会导致更多人使用A呢?反而使得总量下降的更多? : 觉得这些以及followup都可以跟面试官讨论。人家可能是看你的思路。
|
s*y 发帖数: 18644 | 9 i'd choose A. people who bought B don't really care about using a lot of gas
for certain reason. but i'd choose to research on Y, feel like there's more
potential for improvement.
【在 h***i 的大作中提到】 : 这两种车不是一种类型 一个是八缸 一个是电车 估计是这个意思
|
h****y 发帖数: 33 | 10 对了,有个问题忘记写了。
SQL的还有一个问题:
(注:开始时让计算over all click-through rate)
计算得到这个click-through rate是1.4,这说明了什么?
【在 w**p 的大作中提到】 : A mpg已经很高了,再提升没啥意义. : 而B是个油耗子,显然apply y,research on b没啥问题 : 第二题,很简单的sql题啊.
|
|
|
w**p 发帖数: 4080 | 11 rate大于1是有可能的.因为一个人可能会点进一个链接超过1次.
当然,你可以设计个算法,把同一个人点击的多次的情况只算成点击一次.
【在 h****y 的大作中提到】 : 对了,有个问题忘记写了。 : SQL的还有一个问题: : (注:开始时让计算over all click-through rate) : 计算得到这个click-through rate是1.4,这说明了什么?
|
w**p 发帖数: 4080 | 12 楼主的题只是说减少gas,然后假设开两种车的人一样多,每天开的距离一样了.
这里并不需要考虑开车的人是不是care using 多少gas
假设两种车都是每天开75迈.
车A用油从1.5加仑降低到1加仑
车B从7.5加仑降低到6.8加仑.
车A节约了0.5加仑,车B节约了0.7加仑.显然投资B划算.
gas
more
【在 s*y 的大作中提到】 : i'd choose A. people who bought B don't really care about using a lot of gas : for certain reason. but i'd choose to research on Y, feel like there's more : potential for improvement.
|
h****y 发帖数: 33 | 13 嗯,我有提到说一个链接被点的次数超过1,但对方没有任何回应,好像是等我说更多。
不是很清楚他的考查点是什么。
感觉对方需要的是要把每个问题的每个点都答对才行,没有容错空间。导致有点压力递
增的感觉。
【在 w**p 的大作中提到】 : rate大于1是有可能的.因为一个人可能会点进一个链接超过1次. : 当然,你可以设计个算法,把同一个人点击的多次的情况只算成点击一次.
|
w**p 发帖数: 4080 | 14 这个rate居然这么高,感觉很奇怪.
是不是impression单位不是1而是million啊?
多。
【在 h****y 的大作中提到】 : 嗯,我有提到说一个链接被点的次数超过1,但对方没有任何回应,好像是等我说更多。 : 不是很清楚他的考查点是什么。 : 感觉对方需要的是要把每个问题的每个点都答对才行,没有容错空间。导致有点压力递 : 增的感觉。
|
h****y 发帖数: 33 | 15 单位是1.
我问了这个是1.4%还是1.4,他说就是1.4
【在 w**p 的大作中提到】 : 这个rate居然这么高,感觉很奇怪. : 是不是impression单位不是1而是million啊? : : 多。
|
s*y 发帖数: 18644 | 16 my point is,saving on gas is not a selling point
for people who want to buy B. why waste the investment on B. Its not about
how much gas you save for individuals, its about how many cars you sell and
the total gas dependence.
【在 w**p 的大作中提到】 : 楼主的题只是说减少gas,然后假设开两种车的人一样多,每天开的距离一样了. : 这里并不需要考虑开车的人是不是care using 多少gas : 假设两种车都是每天开75迈. : 车A用油从1.5加仑降低到1加仑 : 车B从7.5加仑降低到6.8加仑. : 车A节约了0.5加仑,车B节约了0.7加仑.显然投资B划算. : : gas : more
|
w**p 发帖数: 4080 | 17 人家面试官只问那个投资哪个更省油
你扯卖车之类的干嘛? 人家早就给了前提,两种车使用人数一样,你还在这扯哪个车更好
卖干嘛?
and
【在 s*y 的大作中提到】 : my point is,saving on gas is not a selling point : for people who want to buy B. why waste the investment on B. Its not about : how much gas you save for individuals, its about how many cars you sell and : the total gas dependence.
|
g******2 发帖数: 234 | 18 for CTR = 1.4 question, I think the next thing to check is to see how many
impressions for this app to understand how reliable this CTR is. CTR = 1.4
for 1000 impressions should have very different meaning than CTR = 1.4 for
10 impressions. If # of impressions is low, it may be tail behavior, nothing
to worry about. If # of impressions is high, then may be spamming or some
weirdness going on, need to spend time to investigate/study. |