s**d 发帖数: 148 | 1 How to recode a categorical variable including different and dynamic
information?
column:
Person PID
row(long strings): name age salary 1
.....................
name status level 5000
......................
age level gender 100000
................. |
k*****u 发帖数: 1688 | 2 问题是什么意思?很多categorical variable降维? |
s**d 发帖数: 148 | 3 一个categorical variable是一个长的,动态(并且含有noise) 的字符串的组合,例如:
有的是:name + "noise1"+ age + salary
有的是:name + status+ "noise2" + level
有的是:age + level + gender +"noise3"
.......
问题:怎样对这个复杂分类变量降维,能被分析?
【在 k*****u 的大作中提到】 : 问题是什么意思?很多categorical variable降维?
|
I*****a 发帖数: 5425 | 4 dont understand the question.
do u need to arbitrarily define some patterns of the strings for doing this ?
如:
【在 s**d 的大作中提到】 : 一个categorical variable是一个长的,动态(并且含有noise) 的字符串的组合,例如: : 有的是:name + "noise1"+ age + salary : 有的是:name + status+ "noise2" + level : 有的是:age + level + gender +"noise3" : ....... : 问题:怎样对这个复杂分类变量降维,能被分析?
|
s**d 发帖数: 148 | 5 Yes, I meant "arbitrarily define some patterns".
this ?
【在 I*****a 的大作中提到】 : dont understand the question. : do u need to arbitrarily define some patterns of the strings for doing this ? : : 如:
|
I*****a 发帖数: 5425 | 6 generate many dummy variables for these arbitrary patterns?
【在 s**d 的大作中提到】 : Yes, I meant "arbitrarily define some patterns". : : this ?
|
s**d 发帖数: 148 | 7 还有没有更好的方法?
【在 I*****a 的大作中提到】 : generate many dummy variables for these arbitrary patterns?
|