由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Quant版 - 请问multi variate linear regression 选择risk factor 问题 (转载)
相关主题
一道关于regression的面试题请教[求助] 分析annuity
CS quantitative admission testdata prediction by regression or better ways (转载)
问个简单题目求暑期实习内推,fall term的实习也可
【stat】quant题目刚面了一家prop shop,基本功太差,活该被虐了
找矿工的一些感想和经验-第一次问一个fat tail的问题
[合集] A problem in linear regression有用 deep learning 赚钱的吗?
问一个regression问题Regresion Model MSCI-GEM
Does Time Series Forecasting really work?cross-sectional的factor和time series的factor
相关话题的讨论汇总
话题: factor话题: regression话题: variate话题: model
进入Quant版参与讨论
1 (共1页)
G******2
发帖数: 579
1
【 以下文字转载自 Statistics 讨论区 】
发信人: Gigi2012 (Gigi), 信区: Statistics
标 题: 请问multi variate linear regression 选择risk factor 问题
发信站: BBS 未名空间站 (Thu Apr 9 23:51:47 2015, 美东)
问大牛一个basic 的问题。
在evaluate 一个 multi variate linear regression.
几个factor 同时被研究,individual correlation coefficient 都不大,只有0.3左
右,不知道为什么被选进了model.
然后每个factor 的coefficient 的R square 都小于0.5。
这个 model 是个好model 吗?
还是我看错地方了?
我的问题1。 不是应该选correlation coefficient 大的factor to enter the model?
还是p value 更重要?
R square 低于0.5 应该留在model 里吗?
选择factor 的原则是什么?
我只有一点biostats 背景。不是很清楚这个问题是我自己不懂呢还是他们错了。请大
家解释一下。谢谢。
P*S
发帖数: 381
2

t-statistic更重要,coefficient绝对值大小取决于variable的单位,并不是决定因素
.如果t-stat是significant,理论上应该都用
coefficient的 R square? 还是单独regression的 r-square?

【在 G******2 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: Gigi2012 (Gigi), 信区: Statistics
: 标 题: 请问multi variate linear regression 选择risk factor 问题
: 发信站: BBS 未名空间站 (Thu Apr 9 23:51:47 2015, 美东)
: 问大牛一个basic 的问题。
: 在evaluate 一个 multi variate linear regression.
: 几个factor 同时被研究,individual correlation coefficient 都不大,只有0.3左
: 右,不知道为什么被选进了model.
: 然后每个factor 的coefficient 的R square 都小于0.5。
: 这个 model 是个好model 吗?

G******2
发帖数: 579
3
他们没有report p value 和t statistics .我还在想是我不懂的原因,一般来说我先
看p value. 不过我可以要求report
R square 看起来是model 的。
给我的sad code 打不丶开。我家电脑没有sas.
说是用的Bayesian schawz criteria selection. 跟我平常用的stepwise 和backwards
selection 不一样。不懂呀。
最小的SBC 和最大的RSQ的variable 被淘汰了,说intuitive judgement 不make
sense 是个dummy variable
用了两个variable 说 SBC 最小值,然后rsq 也最大。然后multivaraite 用了这两个
variable 一起,beta 都不大,没有report p value。f statistic 也没有给我。
我真希望当初读书时多念点Stats 。这都是phd 写的report。我看得稀里糊涂的。可是
平常看文献这些p value是一定要report的。
我是不是应该问这些phd要求数据支持他们选择这些variable 的依据。还是已经给我了
但我看不懂。
叩谢
G******2
发帖数: 579
4
继续问,怎么要求report 有无colineality 。我觉得这些tested variable 长得都太
相似了。
w**********y
发帖数: 1691
5
你问的问题太弱跟你讲起来太麻烦估计要给你补好多101 102的课
简言之,给你东西的人听起来很懂他们的描述非常make sense。不懂的直接请他们教你
吧。
forward selection, stepwise
都是最老的做regression 的方法而且都是被证明了是错误的至少只是approximation.
展开讲太多知识了。你如果常用这些去统计系修两门相关课程吧

【在 G******2 的大作中提到】
: 继续问,怎么要求report 有无colineality 。我觉得这些tested variable 长得都太
: 相似了。

w**********y
发帖数: 1691
6
最老的方法,你要求他们report一个VIF值,如果太大就说明colinearity严重。
不过他们可能会嫌你的要求太弱的。。

【在 G******2 的大作中提到】
: 继续问,怎么要求report 有无colineality 。我觉得这些tested variable 长得都太
: 相似了。

r*******g
发帖数: 453
7
请教一下regression的话不用forward, stepwise 该用什么呢?

.

【在 w**********y 的大作中提到】
: 你问的问题太弱跟你讲起来太麻烦估计要给你补好多101 102的课
: 简言之,给你东西的人听起来很懂他们的描述非常make sense。不懂的直接请他们教你
: 吧。
: forward selection, stepwise
: 都是最老的做regression 的方法而且都是被证明了是错误的至少只是approximation.
: 展开讲太多知识了。你如果常用这些去统计系修两门相关课程吧

w**********y
发帖数: 1691
8
ridge, lasso, forwardstage, sis, etc

【在 r*******g 的大作中提到】
: 请教一下regression的话不用forward, stepwise 该用什么呢?
:
: .

d********t
发帖数: 9628
9
第一个问题笑喷了

【在 G******2 的大作中提到】
: 继续问,怎么要求report 有无colineality 。我觉得这些tested variable 长得都太
: 相似了。

G******2
发帖数: 579
10
谢谢各位的回答。他们补一份report这些问题基本上都答了。
补了一份correlation matrix 还是没给我p value.
也不知道是觉得我反正不懂还是他们数据有问题没报。
这个还是最基本的,下一篇用time series 我真是看晕了。
可能是觉得我反正应该不懂就少了很多解释。结果把我这半桶水晃晕了。
1 (共1页)
进入Quant版参与讨论
相关主题
cross-sectional的factor和time series的factor找矿工的一些感想和经验-第一次
两个关于SDE coefficient的问题。。[合集] A problem in linear regression
非线性模型的变量选择问题问一个regression问题
问个面试题关于 ridge regression 顺便发个面经Does Time Series Forecasting really work?
一道关于regression的面试题请教[求助] 分析annuity
CS quantitative admission testdata prediction by regression or better ways (转载)
问个简单题目求暑期实习内推,fall term的实习也可
【stat】quant题目刚面了一家prop shop,基本功太差,活该被虐了
相关话题的讨论汇总
话题: factor话题: regression话题: variate话题: model