universal hashing的问题 - JobHunting版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

JobHunting版 - universal hashing的问题

相关主题
● how to query in the universal hash table?	● universial hashing 一问
● Qualcomm的面经	● 请教个面试题， tree和hashmap的区别
● hash function design	● 请教尾羊兄关于CLRS重点章节
● 关于hash table	● amazon电面 + facebook 电面
● 求教关于URL的hash function	● Facebook 2 轮电面面经 + 为第三轮求福
● LCA of binary tree的一行CODE不懂。。leetcode上的，请牛牛指教,	● Google店面刚结束
● 问一道老题	● hash function multiplication method
● 微软onsite	● hash table 的entry里存的是内容还是指针？

相关话题的讨论汇总
话题: hashing话题: hash话题: function话题: universal话题: table

进入JobHunting版参与讨论

1

(共1页)

B*****7 发帖数: 137	1 我最近在学clrs，觉得universal hashing这节挺dry的，看的比较困惑，想跟大家请教一些问题。在实际应用中，the size of the set of hashing functions大概有多大？几百？几千？对每个hashing function，是不是都在内存中存一份hash table? If so, is it fair to say that universal hashing is a trade off between memory and CPU time? 另外，以数据库为例，如果库的数据更新了，比如插入或删除了一个纪录，那更新所有的hash tables的时间复杂度是不是O(n), where n is the number of hash tables? 先谢谢啦～
d**********x 发帖数: 4083	2 为啥要每个function村一个table。。。它只是每次换个不同的hash function算吧。。【在 B*****7 的大作中提到】 : 我最近在学clrs，觉得universal hashing这节挺dry的，看的比较困惑，想跟大家请教 : 一些问题。 : 在实际应用中，the size of the set of hashing functions大概有多大？几百？几千 : ？对每个hashing function，是不是都在内存中存一份hash table? If so, is it : fair to say that universal hashing is a trade off between memory and CPU : time? : 另外，以数据库为例，如果库的数据更新了，比如插入或删除了一个纪录，那更新所有 : 的hash tables的时间复杂度是不是O(n), where n is the number of hash tables? : 先谢谢啦～
B*****7 发帖数: 137	3 这也是我比较困惑的地方。如果不换hash table, 换hashing function的意义在哪里呢？因为hashing function最终要map到hash table去找地址，如果不换hash table, n个 key占一个slot的情况永远都不会变啊，如果有的话。【在 d**********x 的大作中提到】 : 为啥要每个function村一个table。。。 : 它只是每次换个不同的hash function算吧。。
d**********x 发帖数: 4083	4 减少collision啊。只用一个hash function的话，如果数据有天然的bias或者人造的bias，很容易导致 collision的【在 B*****7 的大作中提到】 : 这也是我比较困惑的地方。如果不换hash table, 换hashing function的意义在哪里呢 : ？因为hashing function最终要map到hash table去找地址，如果不换hash table, n个 : key占一个slot的情况永远都不会变啊，如果有的话。
B*****7 发帖数: 137	5 这个我理解，但我不理解的是如何用多个hashing function却只用一个hash table。举个例子吧。key1 and key2 are mapped to m1 by hashing function h1, and to m2 by hashing function h2. Apparently, the addresses of elements with key1 and key2, respectively, are stored in slot m1 by h1. When the hashing function is changed to h2, how do their addresses magically appear in slot m2 without storing another hash table with their keys already mapped to m2? 困惑中～～【在 d**********x 的大作中提到】 : 减少collision啊。 : 只用一个hash function的话，如果数据有天然的bias或者人造的bias，很容易导致 : collision的
d*s 发帖数: 699	6 universal hashing，按我的理解，是在每次create instance的时候用随机的hash function, 一旦instantiated之后就不变了，也就是说你的table只要存在就用同样的 hash function访问，但你想攻击我的系统，我只要做一个新的table出来，然后把原来的数据全部copy过来就行了。这个cost amortized之后就忽略不计了
B*****7 发帖数: 137	7 如果以数据库为例，也就是说，系统如果受恶意request攻击就换个hashing function ，然后以新的hashing function重新生成index？【在 d*s 的大作中提到】 : universal hashing，按我的理解，是在每次create instance的时候用随机的hash : function, 一旦instantiated之后就不变了，也就是说你的table只要存在就用同样的 : hash function访问，但你想攻击我的系统，我只要做一个新的table出来，然后把原来 : 的数据全部copy过来就行了。这个cost amortized之后就忽略不计了
d*s 发帖数: 699	8 恶意攻击要有效的话需要知道你用的具体参数，如果没有universal hashing，就靠实现时候对参数的保密，显然不靠谱。有了之后就算公开源代码一般也没办法进行攻击，因为根本不知道具象化之后的database用的p, q, m是多少，我认为需要换函数的情况是十分罕见的 function 【在 B*****7 的大作中提到】 : 如果以数据库为例，也就是说，系统如果受恶意request攻击就换个hashing function : ，然后以新的hashing function重新生成index？
B*****7 发帖数: 137	9 Make sense. 谢谢～哪位数据库大牛给confirm一下？【在 d*s 的大作中提到】 : 恶意攻击要有效的话需要知道你用的具体参数，如果没有universal hashing，就靠实 : 现时候对参数的保密，显然不靠谱。有了之后就算公开源代码一般也没办法进行攻击， : 因为根本不知道具象化之后的database用的p, q, m是多少，我认为需要换函数的情况 : 是十分罕见的 : : function

1

(共1页)

进入JobHunting版参与讨论

相关主题
● hash table 的entry里存的是内容还是指针？	● 求教关于URL的hash function
● 大家都是怎样准备面试的概率题的？	● LCA of binary tree的一行CODE不懂。。leetcode上的，请牛牛指教,
● STL doesn't have hash Table?	● 问一道老题
● 一个关于hash table的interview question	● 微软onsite
● how to query in the universal hash table?	● universial hashing 一问
● Qualcomm的面经	● 请教个面试题， tree和hashmap的区别
● hash function design	● 请教尾羊兄关于CLRS重点章节
● 关于hash table	● amazon电面 + facebook 电面

相关话题的讨论汇总
话题: hashing话题: hash话题: function话题: universal话题: table

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)