G***G 发帖数: 16778 | 1 round(2.5) =2
round(3.5) =4
this happened in R.
why? |
e*******o 发帖数: 4654 | 2 http://www.dummies.com/how-to/content/how-to-round-off-numbers-
If the first digit that is dropped is exactly 5, R uses a rule that’s
common in programming languages: Always round to the nearest even number.
round(1.5) and round(2.5) both return 2, for example, and round(-4.5)
returns -4.
google is your friend. |
g*****y 发帖数: 7271 | 3 round to even to avoid some sort of bias.
【在 G***G 的大作中提到】 : round(2.5) =2 : round(3.5) =4 : this happened in R. : why?
|
w***g 发帖数: 5958 | 4 长见识了。C/C++和python都是四舍五入。我觉得R更合理。
【在 g*****y 的大作中提到】 : round to even to avoid some sort of bias.
|
h*****0 发帖数: 4889 | 5 这是物理及很多学科里面的标准。
【在 w***g 的大作中提到】 : 长见识了。C/C++和python都是四舍五入。我觉得R更合理。
|
N******K 发帖数: 10202 | 6 扯淡呢
【在 h*****0 的大作中提到】 : 这是物理及很多学科里面的标准。
|
N******K 发帖数: 10202 | 7 我看是增加了bias
【在 g*****y 的大作中提到】 : round to even to avoid some sort of bias.
|
v*******e 发帖数: 11604 | 8
估计IT科学家没学过统计。是增加了variance,但是去除了bias。
【在 N******K 的大作中提到】 : 我看是增加了bias
|
N******K 发帖数: 10202 | 9 如果是x 从连续均匀分布采样来 比如 [-100, 100]
那么 y=round(x) 采取四舍五入 y的分布 是在整数上的离散均匀分布 均值为0
但是限制到even数字 得到的离散分布 不是在整数上的均匀分布 偶数概率大 奇数概率小
【在 v*******e 的大作中提到】 : : 估计IT科学家没学过统计。是增加了variance,但是去除了bias。
|
v*******e 发帖数: 11604 | 10
你这断言不对,因为你不可能从连续均匀分布采样来,只能是从-100到+100里面能被
float或者double代表的数来。这样结论就不一样了。
率小
这个对,但是对mean的贡献是no bias,这是统计上常用的东西,而谁是偶数谁是奇数
在统计上很少用到。
【在 N******K 的大作中提到】 : 如果是x 从连续均匀分布采样来 比如 [-100, 100] : 那么 y=round(x) 采取四舍五入 y的分布 是在整数上的离散均匀分布 均值为0 : 但是限制到even数字 得到的离散分布 不是在整数上的均匀分布 偶数概率大 奇数概率小
|
N******K 发帖数: 10202 | 11 抽象的谈所谓的“统计上用的少”是没有意义的
比如 要建立一个离散整数均匀分布 显然不能用R中的round
"不可能从连续均匀分布采样" 这个断言也是有问题
从-100到+100里面能被float或者double代表的数来 假设这个数字是x
x是有prior distribution 比如从数字加密机出来的
不考虑p(x) 空谈所谓round到even就是好 是不科学的
另外 不是所有问题都是统计问题
比如把float型的图像存为16bit 像素值x=100.6 量化为100 显然量化误差最小
【在 v*******e 的大作中提到】 : : 你这断言不对,因为你不可能从连续均匀分布采样来,只能是从-100到+100里面能被 : float或者double代表的数来。这样结论就不一样了。 : 率小 : 这个对,但是对mean的贡献是no bias,这是统计上常用的东西,而谁是偶数谁是奇数 : 在统计上很少用到。
|
G***G 发帖数: 16778 | 12 but round (2.5) =2
round (3.5) =4
before round 3.5-2.5=1
after round, their difference becomes 2.
this is not good.
【在 w***g 的大作中提到】 : 长见识了。C/C++和python都是四舍五入。我觉得R更合理。
|
G***G 发帖数: 16778 | 13 I have same feeling.
【在 N******K 的大作中提到】 : 扯淡呢
|
g*****y 发帖数: 7271 | 14 of couse there are cases that this way is not as good as other ways. You
need to decide which way fits your reqirements better.
To give a simple example, averaging two people's money. There will only be
round up or no rounding. hence normal rounding causes bias.
rounding always looses information. Just hope the loss is not what you care.
no magic here.
【在 G***G 的大作中提到】 : but round (2.5) =2 : round (3.5) =4 : before round 3.5-2.5=1 : after round, their difference becomes 2. : this is not good.
|