R*****n 发帖数: 8658 | 1 不知道有没有现成的算法可以用?
我现在有516个observation
每个observation是含有103个值的sequence(take value 0 or 1 on each site,
or possible 3 values on each site)
我现在认为这个sequence可以分成好多blocks
每个block有very low diversity(就是说winthin blocks,ppl tends to have the same
sequences)
这些block可以是不连续的
就是说block之间可以隔着一些site
有没有现成的算法找出这样的block? | k*******y 发帖数: 56 | 2 偶想个土的,
对每个site, get the variance across ppl
thus get 103 variances, their range, say is (0,a)
a=103/4
this forms a vector of length 103, call it svar
choose a screening point, say 5
连续的小于5的site可以认为是同一block里的
如果这个idea大方向没有错,用Splus应该不难
【在 R*****n 的大作中提到】 : 不知道有没有现成的算法可以用? : 我现在有516个observation : 每个observation是含有103个值的sequence(take value 0 or 1 on each site, : or possible 3 values on each site) : 我现在认为这个sequence可以分成好多blocks : 每个block有very low diversity(就是说winthin blocks,ppl tends to have the same : sequences) : 这些block可以是不连续的 : 就是说block之间可以隔着一些site : 有没有现成的算法找出这样的block?
|
|