工作中用到的factor analysis - Statistics版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 工作中用到的factor analysis

相关主题
● [合集] factor analysis 变量的分布问题	● analyze time series data
● Marketing方面用factor analysis 和 cluster analysis的多吗?	● 请教熟悉enterprise miner的一个问题
● 【大包子】Factor data analysis	● joint distribution
● Clustering analysis with categorical variables	● sample size vs. number of regressors
● Principal Components Analysis 中 factor 选择的问题	● 求推荐：data analysis 的实用入门书籍。在此谢过！
● 如何判断一组数据是一个正态分布还是几个正态分布？ (转载)	● logistic regression结果释疑，解读
● 问个工作中遇到的问题	● An interview question
● 有什么mixture models的书推荐？	● 如何在一个regression model里面同时处理continuous和categorical变量

相关话题的讨论汇总
话题: factor话题: analysis话题: mixture话题: variable话题: 归类

进入Statistics版参与讨论

(共1页)

p*p
发帖数: 492

最近公司做东西用到。直接用population data做，大概6000个。发现选定factor
number最后得到的结果不是太一致，(我一共10来个variable).导致我没法convince最
后怎么group好。这其中到底怎么回事？在实际工作中用到的朋友来说说？

s*****n
发帖数: 2174

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
怎么个结果不一致?

【在 p*p 的大作中提到】

: 最近公司做东西用到。直接用population data做，大概6000个。发现选定factor
: number最后得到的结果不是太一致，(我一共10来个variable).导致我没法convince最
: 后怎么group好。这其中到底怎么回事？在实际工作中用到的朋友来说说？

p*p
发帖数: 492

选4个factor得到的group归类和选7个得到的结果很不一致。

【在 s*****n 的大作中提到】

:
: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
: 怎么个结果不一致?

s*****n
发帖数: 2174

factor analysis 怎么还归类呢?
是变量归类还是人的归类?

【在 p*p 的大作中提到】

: 选4个factor得到的group归类和选7个得到的结果很不一致。

p*p
发帖数: 492

我想把那10来个variable归成几类，每一类算一个某某factor
factor analysis不就是用来发现隐藏的因素的么？

【在 s*****n 的大作中提到】

: factor analysis 怎么还归类呢?
: 是变量归类还是人的归类?

s*****n
发帖数: 2174

你说的是把原始的10个variable分类, 还是把找出的隐藏factor分类?
Factor analysis的确是试图找隐藏factor, 可是不存在什么分类问题.
即使要分类, 一般也是把variable进行clustering.

【在 p*p 的大作中提到】

: 我想把那10来个variable归成几类，每一类算一个某某factor
: factor analysis不就是用来发现隐藏的因素的么？

g*******y
发帖数: 380

貌似和我学到的完全不一样,请牛人给解释解释?

【在 p*p 的大作中提到】

: 我想把那10来个variable归成几类，每一类算一个某某factor
: factor analysis不就是用来发现隐藏的因素的么？

p*p
发帖数: 492

is that there are several variables included in one factor? so i consider
this is to group the variables into different factors.

【在 s*****n 的大作中提到】

: 你说的是把原始的10个variable分类, 还是把找出的隐藏factor分类?
: Factor analysis的确是试图找隐藏factor, 可是不存在什么分类问题.
: 即使要分类, 一般也是把variable进行clustering.

g*******t
发帖数: 124

clustering不是对人的分类么，factor是对variable的分类

【在 s*****n 的大作中提到】

g*******t
发帖数: 124

很有可能，你怎么保证你原始数据的正确性。

【在 p*p 的大作中提到】

: 选4个factor得到的group归类和选7个得到的结果很不一致。

相关主题
● 如何判断一组数据是一个正态分布还是几个正态分布？ (转载)	● analyze time series data
● 问个工作中遇到的问题	● 请教熟悉enterprise miner的一个问题
● 有什么mixture models的书推荐？	● joint distribution
进入Statistics版参与讨论

l*******y
发帖数: 22

不知道你的数据是否都是连续的？
我的经验是，做factor analysis有几个必要的步骤
第一，要有domain knowledge。一般去收集数据的人，心中对于有几个factor都大概有
个底。而且在统计分析完成以
后，并且model is verified statistically，背景知识至少也要能解释你的发现。
其次，如果数据是连续的，首先应当将相关矩阵画出来，（维数小的时候肉眼就可以看
出到底有几个类，比如你用
threshold cut掉一些elements）。如果维数很大，可以用一些基于permutation的算法
将聚类自动调整出来。这两步做完
以后，心里基本上就有个大概的了解了。这两部分虽然简单，其实在实际中很重要。
最后，也就是定量分析阶段，这个时候可以选用的模型就太多了。但是最终选用几个
factor，还是需要用定量分析的办法比
一比的。比如你现在的4个vs7个，就是一个很典型的例子。怎么比呢？方法太多了，比
如aic,bic,似然检验，bayesian
factor。但是直观来看，你variable才10几个，聚类就有7个，overfitting的概率实在

【在 p*p 的大作中提到】

x**g
发帖数: 807

factor analysis 是给Variable“归类”，
Mixture Models是给人“归类”。

【在 s*****n 的大作中提到】

: factor analysis 怎么还归类呢?
: 是变量归类还是人的归类?

g*******t
发帖数: 124

mixture models 是什么，我们叫cluster analysis，是一个东西么？

【在 x**g 的大作中提到】

: factor analysis 是给Variable“归类”，
: Mixture Models是给人“归类”。

o****o
发帖数: 8077

不是
mixture model 又叫latent cluster analysis

【在 g*******t 的大作中提到】

: mixture models 是什么，我们叫cluster analysis，是一个东西么？

x**g
发帖数: 807

McLachlan, G.J. and Peel, D.(2000) Finite Mixture Models.Wiley.

【在 g*******t 的大作中提到】

: mixture models 是什么，我们叫cluster analysis，是一个东西么？

(共1页)

进入Statistics版参与讨论

相关主题
● 如何在一个regression model里面同时处理continuous和categorical变量	● Principal Components Analysis 中 factor 选择的问题
● 如何处理很多的zero value？	● 如何判断一组数据是一个正态分布还是几个正态分布？ (转载)
● PCA 可以用在mixture of continuous 和categorical variables	● 问个工作中遇到的问题
● 请教...	● 有什么mixture models的书推荐？
● [合集] factor analysis 变量的分布问题	● analyze time series data
● Marketing方面用factor analysis 和 cluster analysis的多吗?	● 请教熟悉enterprise miner的一个问题
● 【大包子】Factor data analysis	● joint distribution
● Clustering analysis with categorical variables	● sample size vs. number of regressors

相关话题的讨论汇总
话题: factor话题: analysis话题: mixture话题: variable话题: 归类

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天