由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - predict的时候对于test data,要不要standardized?
相关主题
[Data Science Project Case]Future Income predicting问一个关于clustering analysis的问题
time sliced classification models急,xgboost prediction的问题
怎么处理categorical variable有很多个level的[Road map] From ClickStream to ConsumerInsight
数据清理和数据质量控制---大数据时代的挑战之三借版面问个machine learning的问题
洛杉矶LA求Data Science/Stat 相关工作内推,有经验feature selection的方法求教
data challenge ... 现在公司都咋tmd想的model selection problem
工作中遇到的一个现象,问问大家怎么解释 (转载)求大牛指教 “How do you deal with missing data?”
求handle missing data的好方法听说现在很多人上deep learning来挖掘商业潜在信息,想问结果都怎么来结合实际商业问题进行阐述的?
相关话题的讨论汇总
话题: test话题: data话题: predict话题: model
进入DataSciences版参与讨论
1 (共1页)
m******n
发帖数: 453
1
training data一般都需要standardized
建立好模型之后
那么这时候去predict test data
test data也需要一样的标准化处理吗
是不是用原始数据的test data
可是,如果对test data也进行scale的话
predict出来的y,也是标准化的值啊,怎样recover到原来的值去
t******g
发帖数: 2253
2
我觉得要对test做同样的transformation
g**********l
发帖数: 9
3
after transformation and model fitting, you may apply an inverse
transformation to get a model based on the original model.
Say, if you new x is ax, where x is the original explanatory variable and
you get y=b*(new x) as the fitted model, then equivalently, it is y=(ba)*x
in terms of original variable. You can use this model for test data.
s*********h
发帖数: 6288
4
python sklearn包里有很不错的函数可以用。
m******n
发帖数: 453
5
建模时候,需要对y也normalization吗,还是只需要对predictor X进行scale就可以了
1 (共1页)
进入DataSciences版参与讨论
相关主题
听说现在很多人上deep learning来挖掘商业潜在信息,想问结果都怎么来结合实际商业问题进行阐述的?洛杉矶LA求Data Science/Stat 相关工作内推,有经验
推荐个英文网站Date Science Centraldata challenge ... 现在公司都咋tmd想的
[Kaggle Contest] Predict the 2014 NCAA Basketball Tournament工作中遇到的一个现象,问问大家怎么解释 (转载)
问个关于election prediction的面试题目求handle missing data的好方法
[Data Science Project Case]Future Income predicting问一个关于clustering analysis的问题
time sliced classification models急,xgboost prediction的问题
怎么处理categorical variable有很多个level的[Road map] From ClickStream to ConsumerInsight
数据清理和数据质量控制---大数据时代的挑战之三借版面问个machine learning的问题
相关话题的讨论汇总
话题: test话题: data话题: predict话题: model