e****e 发帖数: 677 | 1 附件中图中的曲线是由几万上十万个数据画出,是一个概率分布曲线
现在想要在这条曲线上取N个点(N<1024),使得可以代表这条曲线
N为一个pair,(x,y),x 为数值,y为概率分布累积值(即分别为图中的横轴,纵轴)
请问如何确定最合适的N
以及如何选择这N个点或者说样本
谢谢 | D******n 发帖数: 2836 | 2 Suppose you have your thousands of data points (X1,Y1),....(Xm,Ym)
sample N points (y1,....yN) from U[0,1], then you get (x1....xN)
where xi=Xk|where abs(yi-Yk) is the minimal
【在 e****e 的大作中提到】 : 附件中图中的曲线是由几万上十万个数据画出,是一个概率分布曲线 : 现在想要在这条曲线上取N个点(N<1024),使得可以代表这条曲线 : N为一个pair,(x,y),x 为数值,y为概率分布累积值(即分别为图中的横轴,纵轴) : 请问如何确定最合适的N : 以及如何选择这N个点或者说样本 : 谢谢
| l***a 发帖数: 12410 | 3 one thought to add:
when sampling y1-yN, instead of sample y directly, sample the CDF of a
uniform. then reverse the persentile to find the yi
【在 D******n 的大作中提到】 : Suppose you have your thousands of data points (X1,Y1),....(Xm,Ym) : sample N points (y1,....yN) from U[0,1], then you get (x1....xN) : where xi=Xk|where abs(yi-Yk) is the minimal
| y*****e 发帖数: 777 | 4 如果知道总共多少个点M,可以简单随机抽,如果不知道,可以系统抽。
N的确定看你需要的精度,其实,如果是计算模拟,没什么花费,多抽点也没关系,呵
呵。
然后我觉得可以直接从[1,M]抽N个点,然后对应(xi,yi), | D*********2 发帖数: 535 | 5
re.
【在 l***a 的大作中提到】 : one thought to add: : when sampling y1-yN, instead of sample y directly, sample the CDF of a : uniform. then reverse the persentile to find the yi
| t*******i 发帖数: 742 | 6 这个cdf看起来像阶梯形的
在上升很快的地方就采集几个点
类似水平的地方也采集几个点
应该就能比较精确描述这个cdf了
【在 e****e 的大作中提到】 : 附件中图中的曲线是由几万上十万个数据画出,是一个概率分布曲线 : 现在想要在这条曲线上取N个点(N<1024),使得可以代表这条曲线 : N为一个pair,(x,y),x 为数值,y为概率分布累积值(即分别为图中的横轴,纵轴) : 请问如何确定最合适的N : 以及如何选择这N个点或者说样本 : 谢谢
|
|