g****y 发帖数: 436 | 1 不知道这个问题发在这里合不合适。。
一个数据库的数据由整数表示,已知所有数据的大致范围为(a,b),总数为c,有没有
比较有效的方法在短时间内知道更具体的分布情况。
具体例子:
已知数据范围为(1,10),总数为5,随机测试了三次,得到 8,9,10三个数,猜测
数据有很大可能在(5,10) |
v******y 发帖数: 84 | 2 按照你的描述,不就是求平均值mu和sigma
比如有一万的数字,取10次,平均6000, sigma 1000 那他1 sigma的范围5000- 7000
2sigma 4000-8000
【在 g****y 的大作中提到】 : 不知道这个问题发在这里合不合适。。 : 一个数据库的数据由整数表示,已知所有数据的大致范围为(a,b),总数为c,有没有 : 比较有效的方法在短时间内知道更具体的分布情况。 : 具体例子: : 已知数据范围为(1,10),总数为5,随机测试了三次,得到 8,9,10三个数,猜测 : 数据有很大可能在(5,10)
|
k**********g 发帖数: 989 | 3 Random Sampling for Histogram Construction: How Much is Enough?
http://research.microsoft.com/apps/pubs/default.aspx?id=68350
【在 g****y 的大作中提到】 : 不知道这个问题发在这里合不合适。。 : 一个数据库的数据由整数表示,已知所有数据的大致范围为(a,b),总数为c,有没有 : 比较有效的方法在短时间内知道更具体的分布情况。 : 具体例子: : 已知数据范围为(1,10),总数为5,随机测试了三次,得到 8,9,10三个数,猜测 : 数据有很大可能在(5,10)
|
S*A 发帖数: 7142 | 4 就是求平均数和方差嘛。开始的范围几乎是没有用的。 |
v******y 发帖数: 84 | 5 当然这是假定数据分布是一阶高斯分布
复杂的可以bootstrap,看看到底拟合啥分布,
uniform,高斯,extreme value, Possion 啥的,
估计超出楼主的要求了。
【在 S*A 的大作中提到】 : 就是求平均数和方差嘛。开始的范围几乎是没有用的。
|