Dropbox 电面 - JobHunting版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

相关主题
● 问一个system design的题，看看大家怎么想的。	● Is this a DP problem?
● 问个Google的面试题	● 这个用stack实现queue
● 面完了G	● 求救: 打印binary tree
● web count 设计	● 如何用JAVA中的circular array of queue 解决Josephus problem? (转载)
● question 2: o(1) euque and dequeue?	● 问个题：get max value from Queue, with O(1)?
● 请教一个系统设计问题 (转载)	● F家一道LIS 的变种
● 如何实现binary tree的从下到上的分层打印？	● 面试题
● share 面试题	● 一道很难的面试题

相关话题的讨论汇总
话题: scale话题: bucket话题: hit话题: hitlog

进入JobHunting版参与讨论

(共1页)

l****r
发帖数: 689

Implement two methods (web services)
1. getHit(): return last 5 mins hit
2. hitLog(): called every time the page is loaded
Follow up:
Consider how to scale it

u*****o
发帖数: 1224

好难。。。lz好人，谢谢分享，祝福内！

l****r
发帖数: 689

所以挂了。。。发现原来你也是我大西雅图的哈哈

【在 u*****o 的大作中提到】

: 好难。。。lz好人，谢谢分享，祝福内！

s********f
发帖数: 510

数据结构是一个数组，size 300 (1 sec 1 bucket), 初始化每个bucket都是0.
hitlog: bucket = sec % 300, array[bucket]++
get: return sum of the array
如果需要scale，需要考虑的问题有
1) 数组不能放在单个server上了，需要distributed cache (比如memcache 或者
redis)。
2) 一秒一个bucket是不是导致溢出，可以更精度再小一些，比如10millisec 一个。

m********a
发帖数: 128

how to scale 啊？

【在 l****r 的大作中提到】

: Implement two methods (web services)
: 1. getHit(): return last 5 mins hit
: 2. hitLog(): called every time the page is loaded
: Follow up:
: Consider how to scale it

l****r
发帖数: 689

但是你这样不是最近5min的啊比如301 秒和 1秒的会重复计算了
应该用这个数组做shifting吧

【在 s********f 的大作中提到】

: 数据结构是一个数组，size 300 (1 sec 1 bucket), 初始化每个bucket都是0.
: hitlog: bucket = sec % 300, array[bucket]++
: get: return sum of the array
: 如果需要scale，需要考虑的问题有
: 1) 数组不能放在单个server上了，需要distributed cache (比如memcache 或者
: redis)。
: 2) 一秒一个bucket是不是导致溢出，可以更精度再小一些，比如10millisec 一个。

j**********3
发帖数: 3211

请问是new grad么？谢谢lz

l****r
发帖数: 689

不是

【在 j**********3 的大作中提到】

: 请问是new grad么？谢谢lz

y*******g
发帖数: 6599

这个一般无所谓。

【在 l****r 的大作中提到】

:
: 不是

s********f
发帖数: 510

是的，需要有一个清零的job，每秒跑一次把现在的bucket清零。
不过这个很难做到绝对精度的5分钟，总要损失一些（或多或少）。
另外scale大了以后可以用double做counter，每次不是加1而是0.1或者0.01, get的时
候需要scale up。

【在 l****r 的大作中提到】

:
: 不是

相关主题
● 请教一个系统设计问题 (转载)	● Is this a DP problem?
● 如何实现binary tree的从下到上的分层打印？	● 这个用stack实现queue
● share 面试题	● 求救: 打印binary tree
进入JobHunting版参与讨论

l****r
发帖数: 689

我电面的时候就是提出这个方案，有一个backend job，但是被否决了。

：是的，需要有一个清零的job，每秒跑一次把现在的bucket清零。
：不过这个很难做到绝对精度的5分钟，总要损失一些（或多或少）。

r*****3
发帖数: 27

用一个类似双向Queue的结构?
queue存的是(time, count)
每次hit 都看一下queue里面最后一个元素的时间是否一样, 如果一样就count++, 如果
不一样就把(time, 1)压进去
hit的时候可以顺便把超过30min的头部都dequeue...
不知道这样可不可以 scale不清楚 - -

l****r
发帖数: 689

这个我也提到了类似的，当时他说，那如果一直没有调用gethit呢，空间就会越来越大
。。。。
最后是用了一个数组来做的，每次都位移。。。

：用一个类似双向Queue的结构?
：

s********f
发帖数: 510

不一定需要一个backend job。假设每秒都有hit，那么在incr counter的同时把下一秒
清零就可以了。
如果不能保证每秒都有hit，才需要backend job。

【在 l****r 的大作中提到】

: 我电面的时候就是提出这个方案，有一个backend job，但是被否决了。
:
: ：是的，需要有一个清零的job，每秒跑一次把现在的bucket清零。
: ：不过这个很难做到绝对精度的5分钟，总要损失一些（或多或少）。

y**********u
发帖数: 6366

这个是不是也可以用来做rateLimiter的呢？
interface rateLimiter {
void setQps (int maxQps);
boolean acceptRequest (Request request);
}

【在 s********f 的大作中提到】

: 不一定需要一个backend job。假设每秒都有hit，那么在incr counter的同时把下一秒
: 清零就可以了。
: 如果不能保证每秒都有hit，才需要backend job。

l****r
发帖数: 689

Implement two methods (web services)
1. getHit(): return last 5 mins hit
2. hitLog(): called every time the page is loaded
Follow up:
Consider how to scale it

u*****o
发帖数: 1224

好难。。。lz好人，谢谢分享，祝福内！

l****r
发帖数: 689

所以挂了。。。发现原来你也是我大西雅图的哈哈

【在 u*****o 的大作中提到】

: 好难。。。lz好人，谢谢分享，祝福内！

s********f
发帖数: 510

m********a
发帖数: 128

how to scale 啊？

【在 l****r 的大作中提到】

: Implement two methods (web services)
: 1. getHit(): return last 5 mins hit
: 2. hitLog(): called every time the page is loaded
: Follow up:
: Consider how to scale it

相关主题
● 如何用JAVA中的circular array of queue 解决Josephus problem? (转载)	● 面试题
● 问个题：get max value from Queue, with O(1)?	● 一道很难的面试题
● F家一道LIS 的变种	● Two programming questions...
进入JobHunting版参与讨论

l****r
发帖数: 689

但是你这样不是最近5min的啊比如301 秒和 1秒的会重复计算了
应该用这个数组做shifting吧

【在 s********f 的大作中提到】

j**********3
发帖数: 3211

请问是new grad么？谢谢lz

l****r
发帖数: 689

不是

【在 j**********3 的大作中提到】

: 请问是new grad么？谢谢lz

y*******g
发帖数: 6599

这个一般无所谓。

【在 l****r 的大作中提到】

:
: 不是

s********f
发帖数: 510

:
: 不是

l****r
发帖数: 689

r*****3
发帖数: 27

l****r
发帖数: 689

s********f
发帖数: 510

y**********u
发帖数: 6366

这个是不是也可以用来做rateLimiter的呢？
interface rateLimiter {
void setQps (int maxQps);
boolean acceptRequest (Request request);
}

【在 s********f 的大作中提到】

: 不一定需要一个backend job。假设每秒都有hit，那么在incr counter的同时把下一秒
: 清零就可以了。
: 如果不能保证每秒都有hit，才需要backend job。

相关主题
● F家电面	● 问个Google的面试题
● A家电面	● 面完了G
● 问一个system design的题，看看大家怎么想的。	● web count 设计
进入JobHunting版参与讨论

s*****B
发帖数: 32

http://www.mitbbs.com/article_t/JobHunting/32549839.html

(共1页)

进入JobHunting版参与讨论

相关主题
● 一道很难的面试题	● question 2: o(1) euque and dequeue?
● Two programming questions...	● 请教一个系统设计问题 (转载)
● F家电面	● 如何实现binary tree的从下到上的分层打印？
● A家电面	● share 面试题
● 问一个system design的题，看看大家怎么想的。	● Is this a DP problem?
● 问个Google的面试题	● 这个用stack实现queue
● 面完了G	● 求救: 打印binary tree
● web count 设计	● 如何用JAVA中的circular array of queue 解决Josephus problem? (转载)

相关话题的讨论汇总
话题: scale话题: bucket话题: hit话题: hitlog

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天