s******0 发帖数: 6 | 1 这个抽象的数据库问题是这样的:
有N方共享一个分布式的数据库,假定有3方吧:P1,P2,P3。他们的数据库有相同的属性
构成,假定有4个属性(A,B,C,D)吧。他们的记录集内容不同,但个数相等。假定他们
都有2个记录吧,如下:
P1有记录T1=(a1,b1,c1,d1),T2=(a2,b1,c2,d1);
P2有记录T3=(a1,b1,c1,d1),T4=(a2,b1,c2,d3);
P3有记录T5=(a1,b1,c1,d1),T6=(a1,b1,c2,d4);
P1,P2,P3都想找出他们的记录是否有如下特性:该记录所有属性值在对应的属性值三方
并集中出现至少k次。
A属性的三方并集是{a1,a2},B属性的三方并集是{b1},C属性的三方并集是{c1,c2},D
属性的三方并集是{d1,d3,d4}。假定k=2,这样很容易看出:
T1的四个属性值都在对应的属性值三方并集中出现至少两次。符合要求的记录还有T2,
T3,T5。而T4和T6不符合这个要求。
现在鄙人为解决这个问题做了一些算法改进,写了篇文章,但审稿人一定要求我给这个
问题找个实际的应用环境,否则就卡卡掉,郁闷啊!
最近 | M*****r 发帖数: 1536 | | B*****g 发帖数: 34098 | 3 你是说fault tolerance? 这个应该是点对点match吧,要是说并集实在想不出来。
【在 M*****r 的大作中提到】 : Backup/Restore?
| M*****r 发帖数: 1536 | 4 对对,还是你的术语准确
我是想,这个分布式系统,比如lz给的例子,如果T4/T6 lost,没有办法用其他地方的
数据恢复,但是其他的记录就可以。
【在 B*****g 的大作中提到】 : 你是说fault tolerance? 这个应该是点对点match吧,要是说并集实在想不出来。
| j*****n 发帖数: 1781 | | s******0 发帖数: 6 | 6 是Database replication吗? 好像也是不行。 3x!
【在 j*****n 的大作中提到】 : Replication?
| k*******s 发帖数: 134 | 7 这样很容易看出:
T1的四个属性值都在对应的属性值三方并集中出现至少两次。符合要求的记录还有T2,
T3,T5。而T4和T6不符合这个要求。
什么原因就变得容易看出了? | B*****g 发帖数: 34098 | 8 ft。人家还要发表呢,哪能告诉你。呵呵
【在 k*******s 的大作中提到】 : 这样很容易看出: : T1的四个属性值都在对应的属性值三方并集中出现至少两次。符合要求的记录还有T2, : T3,T5。而T4和T6不符合这个要求。 : 什么原因就变得容易看出了?
| s******0 发帖数: 6 | 9 在这个简单的例子里数一下就可以了。我做得问题实际上跟这个原始问题还不太一样,
考虑了一些安全方面的要求。
【在 k*******s 的大作中提到】 : 这样很容易看出: : T1的四个属性值都在对应的属性值三方并集中出现至少两次。符合要求的记录还有T2, : T3,T5。而T4和T6不符合这个要求。 : 什么原因就变得容易看出了?
|
|