b*****d 发帖数: 7166 | 1 【 以下文字转载自 Statistics 讨论区 】
发信人: biokold (kold), 信区: Statistics
标 题: regression的问题:怎么处理bad data
发信站: BBS 未名空间站 (Fri May 16 02:40:37 2014, 美东)
现在要做一个线性回归分析。数据是每5分钟记录一次的股票价格,共10年时间。
问题有
1.怎样判断数据是否是错的(比如太离谱的,负的等等)?有什么一般的方法判断吗?
2.怎么处理错的数据,直接扔掉?因为要做回归,比如regressor选为过去1天的数字,
那么就不能扔掉。这时要把错的数据改成一个猜测的数字吗?
3.有什么通用的办法引入一个权重,使得近期的数据权重更大?比如指数函数还是多项
式函数,哪个更合理?
谢谢! |
|