v****e 发帖数: 19471 | 1 【 以下文字转载自 LosAngeles 讨论区 】
发信人: vankie (新浪微博@洛城王二), 信区: LosAngeles
标 题: 请教statistics, market research大拿
发信站: BBS 未名空间站 (Thu Nov 10 13:00:11 2011, 美东)
想分析某货物的平均售价与当地地区人口、当地平均年龄和当地平均收入的相关性。有
2000个zip codes,针对每个zipcodes有4个数据:平均售价,人口,平均年龄,平均收
入。请问大拿用excel自带的统计分析工具如何搞比较合理? | d******e 发帖数: 551 | 2 Try log and then conduct linear regression
log(price) = log(population)+age+income
or
price = log(population)+age+income
2/3 train-test
1/3 holdout look for model power
For 2000 data points you can use R (free download).
【在 v****e 的大作中提到】 : 【 以下文字转载自 LosAngeles 讨论区 】 : 发信人: vankie (新浪微博@洛城王二), 信区: LosAngeles : 标 题: 请教statistics, market research大拿 : 发信站: BBS 未名空间站 (Thu Nov 10 13:00:11 2011, 美东) : 想分析某货物的平均售价与当地地区人口、当地平均年龄和当地平均收入的相关性。有 : 2000个zip codes,针对每个zipcodes有4个数据:平均售价,人口,平均年龄,平均收 : 入。请问大拿用excel自带的统计分析工具如何搞比较合理?
| k*****u 发帖数: 1688 | |
|