a********e 发帖数: 78 | 1 一个数据集存在一些outlier (或者说和其他数据点比较不同), 在对这个数据集建
立预测模型(比如 用回归分析)的时候应该如何处理这些outlier? 当然可以把这些
outlier分离出来不要。 但假如希望这个模型能够包含这些outlier的话,应该怎么办
。一般哪些模型能够比较好的容忍这些outlier。 |
f****s 发帖数: 3078 | 2 robust regression might work
【在 a********e 的大作中提到】 : 一个数据集存在一些outlier (或者说和其他数据点比较不同), 在对这个数据集建 : 立预测模型(比如 用回归分析)的时候应该如何处理这些outlier? 当然可以把这些 : outlier分离出来不要。 但假如希望这个模型能够包含这些outlier的话,应该怎么办 : 。一般哪些模型能够比较好的容忍这些outlier。
|
t*****w 发帖数: 254 | 3 do you think those outliers are reproducible? |
a********e 发帖数: 78 | 4 Yes, they are reproducible.
The total data set has about 300 records, the outlier set has about 20
records.
【在 t*****w 的大作中提到】 : do you think those outliers are reproducible?
|
S******y 发帖数: 1123 | 5 要具体情况具体分析吧
Sometimes they might represent a different segment in business statistics |
a********e 发帖数: 78 | 6 一个数据集存在一些outlier (或者说和其他数据点比较不同), 在对这个数据集建
立预测模型(比如 用回归分析)的时候应该如何处理这些outlier? 当然可以把这些
outlier分离出来不要。 但假如希望这个模型能够包含这些outlier的话,应该怎么办
。一般哪些模型能够比较好的容忍这些outlier。 |
f****s 发帖数: 3078 | 7 robust regression might work
【在 a********e 的大作中提到】 : 一个数据集存在一些outlier (或者说和其他数据点比较不同), 在对这个数据集建 : 立预测模型(比如 用回归分析)的时候应该如何处理这些outlier? 当然可以把这些 : outlier分离出来不要。 但假如希望这个模型能够包含这些outlier的话,应该怎么办 : 。一般哪些模型能够比较好的容忍这些outlier。
|
t*****w 发帖数: 254 | 8 do you think those outliers are reproducible? |
a********e 发帖数: 78 | 9 Yes, they are reproducible.
The total data set has about 300 records, the outlier set has about 20
records.
【在 t*****w 的大作中提到】 : do you think those outliers are reproducible?
|
S******y 发帖数: 1123 | 10 要具体情况具体分析吧
Sometimes they might represent a different segment in business statistics |
l*****y 发帖数: 33 | 11 Do not just simply want to remove these outliers. Some outliers maybe
valuable for the business cases. |