s******0 发帖数: 6 | 1 这个抽象的数据库问题是这样的:
有N方共享一个分布式的数据库,假定有3方吧:P1,P2,P3。他们的数据库有相同的属性
构成,假定有4个属性(A,B,C,D)吧。他们的记录集内容不同,但个数相等。假定他们
都有2个记录吧,如下:
P1有记录T1=(a1,b1,c1,d1),T2=(a2,b1,c2,d1);
P2有记录T3=(a1,b1,c1,d1),T4=(a2,b1,c2,d3);
P3有记录T5=(a1,b1,c1,d1),T6=(a1,b1,c2,d4);
P1,P2,P3都想找出他们的记录是否有如下特性:该记录所有属性值在对应的属性值三方
并集中出现至少k次。
A属性的三方并集是{a1,a2},B属性的三方并集是{b1},C属性的三方并集是{c1,c2},D
属性的三方并集是{d1,d3,d4}。假定k=2,这样很容易看出:
T1的四个属性值都在对应的属性值三方并集中出现至少两次。符合要求的记录还有T2,
T3,T5。而T4和T6不符合这个要求。
现在鄙人为解决这个问题做了一些算法改进,写了篇文章,但审稿人一定要求我给这个
问题找个实际的应用环境,否则就卡卡掉,郁闷啊!
最近 |
|