由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 贡献一个VMWARE的online test题目
相关主题
大公司算法题FY2014 名额满了
RP Amazon Third phone为什么很多人都在说h1b烙印multiple filing?
Google店面刚结束问个OPT gap cap申H1B的问题
Amazon 电面归来烙印不同公司file多个h1b是否会造成严重名额浪费?
问一道刚面试完的algorithm 的题, 面试官非要最优解,我想不出来啊dropbox 要求真高啊
USCIS 关于quota的消息H1B Duplicate?
两个不同的公司同时帮我申请不同职位的H1b有什么问题么?今年的H1B提前满了。
拿了2个offer,准备同时申请H1B,有无风险?今年H1B抽签很可能会不同于往年
相关话题的讨论汇总
话题: file话题: files话题: column话题: size话题: vmware
进入JobHunting版参与讨论
1 (共1页)
u*****o
发帖数: 1224
1
60分钟就一道题,design一个function to find duplicate files
input是一个path 比如 C: or /home/users/anne
这个function会return所有有duplicates的file
column 1: file name
column 2: file size...
column 3: number of files with the same file contents
column 4: total space would be saved...
好难哪。。想了半天就想了个用sort先sort size,file size一样的再进行下一步比较。
比较contents得用hash吧,然后...就没有然后了。。。
对这种design的题完全傻眼呀。。。算了爱咋咋地吧。
b**********5
发帖数: 7881
2
什么叫design一个function, 不要写code么? 为什么没有了, 你想的挺对啊。
size一先sort, 一样, 再比较contents, 然后就可以output那些stats了啊
u*****o
发帖数: 1224
3
要写code呀,而且得先写file这个class,再写solution class, 我在60分钟内根本没
写完,后面还有一大堆part2-part4,我说的这个是part1而已呀,后面的看都没看清。
坑爹呀,真的有人能在60分钟内写完所有吗。。。

【在 b**********5 的大作中提到】
: 什么叫design一个function, 不要写code么? 为什么没有了, 你想的挺对啊。
: size一先sort, 一样, 再比较contents, 然后就可以output那些stats了啊

l*n
发帖数: 529
4
你已经设计好了啊,就因为要用hash就“爱咋咋地”?
ps.文件大小基本可以不用考虑,反而增加麻烦,有了hash直接比较就是了。每个文件
每行搞个hash,然后综合起来弄个hash。先比较文件的hash,如果一样再回头去比较每
一行的hash。
edit:
搜了一下,文件全文读取太浪费,这个方案不错。
http://stackoverflow.com/a/1761623/2073130
l*n
发帖数: 529
5
file class也要你自己写?不是吧。

【在 u*****o 的大作中提到】
: 要写code呀,而且得先写file这个class,再写solution class, 我在60分钟内根本没
: 写完,后面还有一大堆part2-part4,我说的这个是part1而已呀,后面的看都没看清。
: 坑爹呀,真的有人能在60分钟内写完所有吗。。。

b**********5
发帖数: 7881
6
这个file class, 不就是size, name, 然后就是content。

【在 u*****o 的大作中提到】
: 要写code呀,而且得先写file这个class,再写solution class, 我在60分钟内根本没
: 写完,后面还有一大堆part2-part4,我说的这个是part1而已呀,后面的看都没看清。
: 坑爹呀,真的有人能在60分钟内写完所有吗。。。

b**********5
发帖数: 7881
7
不考虑, 怎么output那些stats?

【在 l*n 的大作中提到】
: 你已经设计好了啊,就因为要用hash就“爱咋咋地”?
: ps.文件大小基本可以不用考虑,反而增加麻烦,有了hash直接比较就是了。每个文件
: 每行搞个hash,然后综合起来弄个hash。先比较文件的hash,如果一样再回头去比较每
: 一行的hash。
: edit:
: 搜了一下,文件全文读取太浪费,这个方案不错。
: http://stackoverflow.com/a/1761623/2073130

l********r
发帖数: 140
8
有大牛看看吗?
My way is:
Go through all the files and create a hashtable: file-signature ==> a set of
the actually files. Only need to study the files in one set (they are more
likely to be the same).
This sounds like a coding question instead of any algorithm question? (
unless we need a really good way to get the file signature)
1 (共1页)
进入JobHunting版参与讨论
相关主题
今年H1B抽签很可能会不同于往年问一道刚面试完的algorithm 的题, 面试官非要最优解,我想不出来啊
You have 100 files, each containing 10G sorted integers. 求解?USCIS 关于quota的消息
G面试题求解两个不同的公司同时帮我申请不同职位的H1b有什么问题么?
为什么加个结束符leetcode就run time error呢?拿了2个offer,准备同时申请H1B,有无风险?
大公司算法题FY2014 名额满了
RP Amazon Third phone为什么很多人都在说h1b烙印multiple filing?
Google店面刚结束问个OPT gap cap申H1B的问题
Amazon 电面归来烙印不同公司file多个h1b是否会造成严重名额浪费?
相关话题的讨论汇总
话题: file话题: files话题: column话题: size话题: vmware