g*******u 发帖数: 3948 | 1 以前看过 没进去看 真要用了 又不确定哪个是常规的
比如 有其他的数字的 特征。 还有 比如 男女的
简单的 吧男的 转成0 女的转成1 还有更通用的常规的办法吗?
thx |
w***g 发帖数: 5958 | 2 one hot encoding。
【在 g*******u 的大作中提到】 : 以前看过 没进去看 真要用了 又不确定哪个是常规的 : 比如 有其他的数字的 特征。 还有 比如 男女的 : 简单的 吧男的 转成0 女的转成1 还有更通用的常规的办法吗? : thx
|
g*******u 发帖数: 3948 | 3 这个one hot 我知道啊
就转成 01 序列了呗 然后和其他的 数字特征连起来就完事了?
【在 w***g 的大作中提到】 : one hot encoding。
|
w***g 发帖数: 5958 | 4 完事了。
【在 g*******u 的大作中提到】 : 这个one hot 我知道啊 : 就转成 01 序列了呗 然后和其他的 数字特征连起来就完事了?
|
g*******u 发帖数: 3948 | 5 ....
好吧
我还以为有其他奇技淫巧呢
多谢大牛
【在 w***g 的大作中提到】 : 完事了。
|
M********0 发帖数: 1230 | 6 同时也看你用什么库
xgb的话就只能one-hot了 但是如果high-cardinality的话用lgbm可以直接做ordinal
encoding
nn的话也只能one-hot |
w***g 发帖数: 5958 | 7 想起来还有一个word2vec, 用来做category很多的情况。
:同时也看你用什么库
:xgb的话就只能one-hot了 但是如果high-cardinality的话用lgbm可以直接做ordinal |
g*******u 发帖数: 3948 | 8 我就 些 比如 男女啊 年龄啊, state 信息
所以 估计直接 one-hot 先试试吧
【在 M********0 的大作中提到】 : 同时也看你用什么库 : xgb的话就只能one-hot了 但是如果high-cardinality的话用lgbm可以直接做ordinal : encoding : nn的话也只能one-hot
|
L****8 发帖数: 3938 | 9 这个比较nb的办法
ordinal
【在 w***g 的大作中提到】 : 想起来还有一个word2vec, 用来做category很多的情况。 : : :同时也看你用什么库 : :xgb的话就只能one-hot了 但是如果high-cardinality的话用lgbm可以直接做ordinal
|
s********k 发帖数: 6180 | 10 最好还是自己train embedding
【在 w***g 的大作中提到】 : one hot encoding。
|