由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 贡献几道A家intern的题
相关主题
xor cipher面试题求解airBnb电面面经
问一道题(8)A家店面栽在一个老中手里
amazon 电面题目攒RP发A家第一轮电面
请教一个设计test case的问题贡献一道电面/校招题目
请教:C++, 忽略大小写的字符串比较待字闺中版之FAQ
新手问个C++(Thinking in C++ source code)微软面经
BB campus interview 4轮面经贡献几道CS电面题
HashMap, HashTable and Array 有啥区别amazon 第一轮电话面试
相关话题的讨论汇总
话题: xor话题: byte话题: server话题: crc话题: intern
进入JobHunting版参与讨论
1 (共1页)
s*****3
发帖数: 87
1
两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
offer,详细下周谈。自己几乎没做过题,也没系统准备过coding面试,做题数小于30
。能拿到offer全靠本科积累的基础知识,还有一个最重要的原因就是面试问的题都不
难。
另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
y*****n
发帖数: 243
2
Cong~~~之前问过他家recruiter,貌似是说如果intern最后打分高的话是可以直接留下
的。不过那时候是在career fair,说得也不是很清楚
第1题不是很懂啊。只有一个byte不同.然后找不同byte的位置?
s*****3
发帖数: 87
3
对了,第一题还有个条件,就是这两个文件在两台不同的server上,并且彼此之间通信
带宽很小。我当时没有给特别肯定的回答,就说可以考虑用hash和bloom filter。然后
继续谈怎么样去用hash做,以及怎么设计hash函数(大体idea是把文件一段一段的ascii
取模)。对于第二个问题,set用bst实现,coding题我第一次写错了(当时只考虑了左右
字节点,而不是左右子树),后来在他提醒下很快重新写了个实现。

【在 y*****n 的大作中提到】
: Cong~~~之前问过他家recruiter,貌似是说如果intern最后打分高的话是可以直接留下
: 的。不过那时候是在career fair,说得也不是很清楚
: 第1题不是很懂啊。只有一个byte不同.然后找不同byte的位置?

y*****n
发帖数: 243
4
谢谢哦。是要找出那个不同的byte还是什么? 不好意思我对题目不是很理解 = =是说
一个文件中有一个byte在另一个文件中没有出现过嘛?

ascii

【在 s*****3 的大作中提到】
: 对了,第一题还有个条件,就是这两个文件在两台不同的server上,并且彼此之间通信
: 带宽很小。我当时没有给特别肯定的回答,就说可以考虑用hash和bloom filter。然后
: 继续谈怎么样去用hash做,以及怎么设计hash函数(大体idea是把文件一段一段的ascii
: 取模)。对于第二个问题,set用bst实现,coding题我第一次写错了(当时只考虑了左右
: 字节点,而不是左右子树),后来在他提醒下很快重新写了个实现。

c**m
发帖数: 535
5
cong~
Amazon实习如果好好干,留下来的机会还是挺高的。
转fulltime不用单独面试,就看intern时候的表现
d****n
发帖数: 56
6
请问楼主面完之后等回复大概用了多久~ 我周五刚面完~
g*****i
发帖数: 2162
7
intern就早起晚归好好做,A家拿到offer的希望应该挺大,他们在扩张期需要人手.

30

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。自己几乎没做过题,也没系统准备过coding面试,做题数小于30
: 。能拿到offer全靠本科积累的基础知识,还有一个最重要的原因就是面试问的题都不
: 难。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

c*****e
发帖数: 737
8
第一题用xor,因为相同的byte,假设x
x xor x xor x xor ... xor y xor x xor x ...
出来的结果就是要么x,要么0
当你一个个xor,找到第一个不为x不为0的时候,你可以停了。
具体怎么写code可以考虑考虑。

30

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。自己几乎没做过题,也没系统准备过coding面试,做题数小于30
: 。能拿到offer全靠本科积累的基础知识,还有一个最重要的原因就是面试问的题都不
: 难。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

g*******9
发帖数: 2
9
个人觉得第一题不能一个一个的XOR,因为这么比0会需要2个SERVER通讯,此题中SERVER
带宽小。所以我觉得可以先XOR 100M,比较,然后缩减范围,再XOR 50M, 直到小于
100 KB 才开始一个一个的XOR
c*****e
发帖数: 737
10
不需要通讯,因为拿到前3个byte就可以确定x。

SERVER

【在 g*******9 的大作中提到】
: 个人觉得第一题不能一个一个的XOR,因为这么比0会需要2个SERVER通讯,此题中SERVER
: 带宽小。所以我觉得可以先XOR 100M,比较,然后缩减范围,再XOR 50M, 直到小于
: 100 KB 才开始一个一个的XOR

相关主题
新手问个C++(Thinking in C++ source code)airBnb电面面经
BB campus interview 4轮面经A家店面栽在一个老中手里
HashMap, HashTable and Array 有啥区别攒RP发A家第一轮电面
进入JobHunting版参与讨论
y*****n
发帖数: 243
11
啊我懂了。。是说2个文件对应位置上的byte相同。只有一个位置上byte不同。然后找
出来。还是需要2个server通信的。应该用binary search,先在各自那边xor1个然后比
较是否相同。然后各自server上XOR 2个再比较..然后是xor4个然后xor2^n个。直到找
到2个结果不一样。就说明byte在2^(n-1)到2^n的区间內。再从那个区间开始search。

【在 c*****e 的大作中提到】
: 不需要通讯,因为拿到前3个byte就可以确定x。
:
: SERVER

c*****e
发帖数: 737
12
哦,居然在两个server上,那么crc + binary search好了。
hash和crc的function不一样。

30

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。自己几乎没做过题,也没系统准备过coding面试,做题数小于30
: 。能拿到offer全靠本科积累的基础知识,还有一个最重要的原因就是面试问的题都不
: 难。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

y*****n
发帖数: 243
13
弱问,crc是神马?

【在 c*****e 的大作中提到】
: 哦,居然在两个server上,那么crc + binary search好了。
: hash和crc的function不一样。
:
: 30

s*****3
发帖数: 87
14
我是周五面完,接下来的周四收到email的。

【在 d****n 的大作中提到】
: 请问楼主面完之后等回复大概用了多久~ 我周五刚面完~
d****n
发帖数: 56
15
嗯~多谢

【在 s*****3 的大作中提到】
: 我是周五面完,接下来的周四收到email的。
q******8
发帖数: 848
16
能具体说一下吗?

【在 c*****e 的大作中提到】
: 哦,居然在两个server上,那么crc + binary search好了。
: hash和crc的function不一样。
:
: 30

f********8
发帖数: 84
17
CRC是一种传输协议,CS或者CE在计算机网络课上学过的。好像是一种可以自己修复的
传输协议。
s*****3
发帖数: 87
18
两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
offer,详细下周谈。
另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
y*****n
发帖数: 243
19
Cong~~~之前问过他家recruiter,貌似是说如果intern最后打分高的话是可以直接留下
的。不过那时候是在career fair,说得也不是很清楚
第1题不是很懂啊。只有一个byte不同.然后找不同byte的位置?
s*****3
发帖数: 87
20
对了,第一题还有个条件,就是这两个文件在两台不同的server上,并且彼此之间通信
带宽很小。我当时没有给特别肯定的回答,就说可以考虑用hash和bloom filter。然后
继续谈怎么样去用hash做,以及怎么设计hash函数(大体idea是把文件一段一段的ascii
取模)。对于第二个问题,set用bst实现,coding题我第一次写错了(当时只考虑了左右
字节点,而不是左右子树),后来在他提醒下很快重新写了个实现。

【在 y*****n 的大作中提到】
: Cong~~~之前问过他家recruiter,貌似是说如果intern最后打分高的话是可以直接留下
: 的。不过那时候是在career fair,说得也不是很清楚
: 第1题不是很懂啊。只有一个byte不同.然后找不同byte的位置?

相关主题
贡献一道电面/校招题目贡献几道CS电面题
待字闺中版之FAQamazon 第一轮电话面试
微软面经面经+求助
进入JobHunting版参与讨论
y*****n
发帖数: 243
21
谢谢哦。是要找出那个不同的byte还是什么? 不好意思我对题目不是很理解 = =是说
一个文件中有一个byte在另一个文件中没有出现过嘛?

ascii

【在 s*****3 的大作中提到】
: 对了,第一题还有个条件,就是这两个文件在两台不同的server上,并且彼此之间通信
: 带宽很小。我当时没有给特别肯定的回答,就说可以考虑用hash和bloom filter。然后
: 继续谈怎么样去用hash做,以及怎么设计hash函数(大体idea是把文件一段一段的ascii
: 取模)。对于第二个问题,set用bst实现,coding题我第一次写错了(当时只考虑了左右
: 字节点,而不是左右子树),后来在他提醒下很快重新写了个实现。

c**m
发帖数: 535
22
cong~
Amazon实习如果好好干,留下来的机会还是挺高的。
转fulltime不用单独面试,就看intern时候的表现
d****n
发帖数: 56
23
请问楼主面完之后等回复大概用了多久~ 我周五刚面完~
g*****i
发帖数: 2162
24
intern就早起晚归好好做,A家拿到offer的希望应该挺大,他们在扩张期需要人手.

30

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

c*****e
发帖数: 737
25
第一题用xor,因为相同的byte,假设x
x xor x xor x xor ... xor y xor x xor x ...
出来的结果就是要么x,要么0
当你一个个xor,找到第一个不为x不为0的时候,你可以停了。
具体怎么写code可以考虑考虑。

30

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

g*******9
发帖数: 2
26
个人觉得第一题不能一个一个的XOR,因为这么比0会需要2个SERVER通讯,此题中SERVER
带宽小。所以我觉得可以先XOR 100M,比较,然后缩减范围,再XOR 50M, 直到小于
100 KB 才开始一个一个的XOR
c*****e
发帖数: 737
27
不需要通讯,因为拿到前3个byte就可以确定x。

SERVER

【在 g*******9 的大作中提到】
: 个人觉得第一题不能一个一个的XOR,因为这么比0会需要2个SERVER通讯,此题中SERVER
: 带宽小。所以我觉得可以先XOR 100M,比较,然后缩减范围,再XOR 50M, 直到小于
: 100 KB 才开始一个一个的XOR

y*****n
发帖数: 243
28
啊我懂了。。是说2个文件对应位置上的byte相同。只有一个位置上byte不同。然后找
出来。还是需要2个server通信的。应该用binary search,先在各自那边xor1个然后比
较是否相同。然后各自server上XOR 2个再比较..然后是xor4个然后xor2^n个。直到找
到2个结果不一样。就说明byte在2^(n-1)到2^n的区间內。再从那个区间开始search。

【在 c*****e 的大作中提到】
: 不需要通讯,因为拿到前3个byte就可以确定x。
:
: SERVER

c*****e
发帖数: 737
29
哦,居然在两个server上,那么crc + binary search好了。
hash和crc的function不一样。

30

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

y*****n
发帖数: 243
30
弱问,crc是神马?

【在 c*****e 的大作中提到】
: 哦,居然在两个server上,那么crc + binary search好了。
: hash和crc的function不一样。
:
: 30

相关主题
讨论一题,去除有序数组的重复元素问一道题(8)
ASCII 的简历有没有什么好的工具 格式的amazon 电面题目
xor cipher面试题求解请教一个设计test case的问题
进入JobHunting版参与讨论
s*****3
发帖数: 87
31
我是周五面完,接下来的周四收到email的。

【在 d****n 的大作中提到】
: 请问楼主面完之后等回复大概用了多久~ 我周五刚面完~
d****n
发帖数: 56
32
嗯~多谢

【在 s*****3 的大作中提到】
: 我是周五面完,接下来的周四收到email的。
q******8
发帖数: 848
33
能具体说一下吗?

【在 c*****e 的大作中提到】
: 哦,居然在两个server上,那么crc + binary search好了。
: hash和crc的function不一样。
:
: 30

f********8
发帖数: 84
34
CRC是一种传输协议,CS或者CE在计算机网络课上学过的。好像是一种可以自己修复的
传输协议。
g*****e
发帖数: 282
35
这里xor足够了。
btw,大家面试时讨论hash function,我想SHA1这种digital sign算法是不是通吃呢,
除了perf比较贵?

【在 f********8 的大作中提到】
: CRC是一种传输协议,CS或者CE在计算机网络课上学过的。好像是一种可以自己修复的
: 传输协议。

b*****e
发帖数: 474
36
CRC is probably an overkill. I'll just segment the file based on memory size
and compute the sum of all the bytes in the segment. Just comparing the
sums would be enough.

【在 c*****e 的大作中提到】
: 哦,居然在两个server上,那么crc + binary search好了。
: hash和crc的function不一样。
:
: 30

C***U
发帖数: 2406
37
cong!

【在 s*****3 的大作中提到】
: 两轮;第一轮问了个设计题,两个1terabyte的文件,只有一个byte不一样,怎么样可
: 以最有效的找到不同byte的位置;第二轮主要问了个coding题,如何判断一个tree是不
: 是binary search tree;另外还问了个C++中set是用什么实现的。之后HR邮件说有
: offer,详细下周谈。
: 另外请教个问题,他家intern转fulltime难么?还是会到时再来一次常规面?非常感谢
: 。

d******i
发帖数: 76
38
如果有带宽小的问题,那么就要结合binary search的思想。
In server 1.
XOR bytes between start and mid position,记录xor的结果,然后将start and mid
positions 这个范围传个server2.
在server2 上同对这个范围内的byte XOR
比较两个XOR的结果。
1. 相同,那么寻找mid + 1 to end 范围内的byte
2. 不同, 寻找 start to mid 范围内的byte
虽然这样double了XOR的次数,但是减少了传输的压力。
不知道这个思路是否和出题者的意图接近,请指正。
s*****1
发帖数: 134
39
冒昧问一下楼上,如果带宽小的话,你一次传输 start到mid的byte数也是很大的额,
误差率会很大啊。。。。。。
求高人给出解答额。。。。。。
d******i
发帖数: 76
40
我说的是把position传过去,然后对另外一个server上两个positions之间的bytes XOR
,我没说传送两个positions之间的byte

【在 s*****1 的大作中提到】
: 冒昧问一下楼上,如果带宽小的话,你一次传输 start到mid的byte数也是很大的额,
: 误差率会很大啊。。。。。。
: 求高人给出解答额。。。。。。

相关主题
请教一个设计test case的问题BB campus interview 4轮面经
请教:C++, 忽略大小写的字符串比较HashMap, HashTable and Array 有啥区别
新手问个C++(Thinking in C++ source code)airBnb电面面经
进入JobHunting版参与讨论
s*****d
发帖数: 21
41
和dafeilei的想法类似诶,Amazon发了篇论文Dynamo有提到:
Hash trees or Merkle trees
http://en.wikipedia.org/wiki/Hash_tree
==================
如果有带宽小的问题,那么就要结合binary search的思想。
In server 1.
XOR bytes between start and mid position,记录xor的结果,然后将start and mid
positions 这个范围传个server2.
在server2 上同对这个范围内的byte XOR
比较两个XOR的结果。
1. 相同,那么寻找mid + 1 to end 范围内的byte
2. 不同, 寻找 start to mid 范围内的byte
虽然这样double了XOR的次数,但是减少了传输的压力。
不知道这个思路是否和出题者的意图接近,请指正。
1 (共1页)
进入JobHunting版参与讨论
相关主题
amazon 第一轮电话面试请教:C++, 忽略大小写的字符串比较
面经+求助新手问个C++(Thinking in C++ source code)
讨论一题,去除有序数组的重复元素BB campus interview 4轮面经
ASCII 的简历有没有什么好的工具 格式的HashMap, HashTable and Array 有啥区别
xor cipher面试题求解airBnb电面面经
问一道题(8)A家店面栽在一个老中手里
amazon 电面题目攒RP发A家第一轮电面
请教一个设计test case的问题贡献一道电面/校招题目
相关话题的讨论汇总
话题: xor话题: byte话题: server话题: crc话题: intern