n*****t 发帖数: 41 | 1 电话面试的3个问题。 1.制造公司的某个产品,大量上百个自变量,一个应变量。工程
人员觉得某个自变量,叫X1吧和 应变量Y相关,但是从散点图看没有相关性,问可能是
什么原因? 我觉得如果是两个变量看起来相关,解释他们实际可能不相关比较容易,比
如有confounding影响。但是实际相关的变量能看起来不相关吗?
2.还是这个问题,样本量很小,但是自变量太大,100多,问怎么处理,这个不难。
3. 假如有另一个大量的样本,但是自变量和 应变量跟 那个小样本都不一样,问这个
大样本有什么办法用来帮助 小样本的 分析? |
s********0 发帖数: 2625 | 2 第一个问题我也不知道怎么回答,但是单纯的例子很好找,比如A车间生产的产品Y和X1
相关,B车间生产的则不相关,然后散点图是根据1个A车间的产品和100个B车间的产品
画出来的。 |
L********d 发帖数: 3820 | 3 第一个问题的可能性是parity function,就是说把其他变量考虑进来就可能使得应变
量和X1相关了。最简单的一个例子,XOR function
X Y Z
0 0 0
0 1 1
1 0 1
1 1 0
如果单看X和Z,他们之间是independent,但是{X,Y}和Z是强相关的
【在 n*****t 的大作中提到】 : 电话面试的3个问题。 1.制造公司的某个产品,大量上百个自变量,一个应变量。工程 : 人员觉得某个自变量,叫X1吧和 应变量Y相关,但是从散点图看没有相关性,问可能是 : 什么原因? 我觉得如果是两个变量看起来相关,解释他们实际可能不相关比较容易,比 : 如有confounding影响。但是实际相关的变量能看起来不相关吗? : 2.还是这个问题,样本量很小,但是自变量太大,100多,问怎么处理,这个不难。 : 3. 假如有另一个大量的样本,但是自变量和 应变量跟 那个小样本都不一样,问这个 : 大样本有什么办法用来帮助 小样本的 分析?
|
L********d 发帖数: 3820 | 4 你这个例子是说数据不是来自于同一个distribution
X1
【在 s********0 的大作中提到】 : 第一个问题我也不知道怎么回答,但是单纯的例子很好找,比如A车间生产的产品Y和X1 : 相关,B车间生产的则不相关,然后散点图是根据1个A车间的产品和100个B车间的产品 : 画出来的。
|