由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 复杂分类变量recoding?
相关主题
在R中ifelse如何运用于variable recoding?如何在一个regression model里面同时处理continuous和categorical变量
请教一个SAS recode variable的问题吧regression prediction问题
Help! A data step problemSAS里关于recode一问
关于recode data的问题,多谢。如何证明数据是伪造的?
R question -- character variable recoding -- what's wrong???[sas] how to recode these variables
也弱问一个SAS里面genotype/SNP variable recoding的问题SPSS 和 R 的问题
SAS 问题missing data question in R
SAS CODE HELP!Data Cleaning
相关话题的讨论汇总
话题: age话题: level话题: name话题: pid
进入Statistics版参与讨论
1 (共1页)
s**d
发帖数: 148
1
How to recode a categorical variable including different and dynamic
information?
column:
Person PID
row(long strings): name age salary 1
.....................
name status level 5000
......................
age level gender 100000
.................
k*****u
发帖数: 1688
2
问题是什么意思?很多categorical variable降维?
s**d
发帖数: 148
3
一个categorical variable是一个长的,动态(并且含有noise) 的字符串的组合,例如:
有的是:name + "noise1"+ age + salary
有的是:name + status+ "noise2" + level
有的是:age + level + gender +"noise3"
.......
问题:怎样对这个复杂分类变量降维,能被分析?

【在 k*****u 的大作中提到】
: 问题是什么意思?很多categorical variable降维?
I*****a
发帖数: 5425
4
dont understand the question.
do u need to arbitrarily define some patterns of the strings for doing this ?

如:

【在 s**d 的大作中提到】
: 一个categorical variable是一个长的,动态(并且含有noise) 的字符串的组合,例如:
: 有的是:name + "noise1"+ age + salary
: 有的是:name + status+ "noise2" + level
: 有的是:age + level + gender +"noise3"
: .......
: 问题:怎样对这个复杂分类变量降维,能被分析?

s**d
发帖数: 148
5
Yes, I meant "arbitrarily define some patterns".

this ?

【在 I*****a 的大作中提到】
: dont understand the question.
: do u need to arbitrarily define some patterns of the strings for doing this ?
:
: 如:

I*****a
发帖数: 5425
6
generate many dummy variables for these arbitrary patterns?

【在 s**d 的大作中提到】
: Yes, I meant "arbitrarily define some patterns".
:
: this ?

s**d
发帖数: 148
7
还有没有更好的方法?

【在 I*****a 的大作中提到】
: generate many dummy variables for these arbitrary patterns?
1 (共1页)
进入Statistics版参与讨论
相关主题
Data CleaningR question -- character variable recoding -- what's wrong???
~回答一个同学们经常问的关于Python培训课的问题也弱问一个SAS里面genotype/SNP variable recoding的问题
how to convert a categorical variable into a continuous variableSAS 问题
一个 proc mixed 的问题SAS CODE HELP!
在R中ifelse如何运用于variable recoding?如何在一个regression model里面同时处理continuous和categorical变量
请教一个SAS recode variable的问题吧regression prediction问题
Help! A data step problemSAS里关于recode一问
关于recode data的问题,多谢。如何证明数据是伪造的?
相关话题的讨论汇总
话题: age话题: level话题: name话题: pid