h***s 发帖数: 2499 | 1 有个model是用的salford的treenet做的,现在想找个免费包复制
最好要在spark上实现. |
n******g 发帖数: 2201 | 2 Xgboost?
[在 hjxds (Kiss My Shiny Metal Ass) 的大作中提到:]
:有个model是用的salford的treenet做的,现在想找个免费包复制
:最好要在spark上实现. |
m******r 发帖数: 1033 | 3 salford好用么 ? 一直想用 太贵。现在被minitab收购了。 |
h***s 发帖数: 2499 | 4 能在spark上轻松对接吗?
【在 n******g 的大作中提到】 : Xgboost? : [在 hjxds (Kiss My Shiny Metal Ass) 的大作中提到:] : :有个model是用的salford的treenet做的,现在想找个免费包复制 : :最好要在spark上实现.
|
h***s 发帖数: 2499 | 5 用是挺好用的,挺象minitab和jmp的,就是不好integrate
免费版30天,下一个用
【在 m******r 的大作中提到】 : salford好用么 ? 一直想用 太贵。现在被minitab收购了。
|
s*********h 发帖数: 6288 | |
h***s 发帖数: 2499 | 7 有个model是用的salford的treenet做的,现在想找个免费包复制
最好要在spark上实现. |
n******g 发帖数: 2201 | 8 Xgboost?
[在 hjxds (Kiss My Shiny Metal Ass) 的大作中提到:]
:有个model是用的salford的treenet做的,现在想找个免费包复制
:最好要在spark上实现. |
m******r 发帖数: 1033 | 9 salford好用么 ? 一直想用 太贵。现在被minitab收购了。 |
h***s 发帖数: 2499 | 10 能在spark上轻松对接吗?
【在 n******g 的大作中提到】 : Xgboost? : [在 hjxds (Kiss My Shiny Metal Ass) 的大作中提到:] : :有个model是用的salford的treenet做的,现在想找个免费包复制 : :最好要在spark上实现.
|
h***s 发帖数: 2499 | 11 用是挺好用的,挺象minitab和jmp的,就是不好integrate
免费版30天,下一个用
【在 m******r 的大作中提到】 : salford好用么 ? 一直想用 太贵。现在被minitab收购了。
|
s*********h 发帖数: 6288 | |
f*********r 发帖数: 30 | 13 最流行据说也是performance最好的就是xgboost了。但是xgboost不是原生支持
categorical变量的,必须自己encode。虽然实际效果来看损失不明显性能基本还是最
优的,但是多少有点缺憾。
微软有个lightgbm,据说性能也是很好,但是我一直没安装成功。微软收购了
Revelution analytics搞了自己的一套r出来,然后做了很多包只能在自己的fork版本
用,为了捆绑助销azure的ml server个人感觉很小气。
H2o的gbm不知道性能如何。但是从random forest的implementation来看,h2o的版本还
是不错的,至少没有Python的rf的自动给categorical变量简化成ordinal的问题 |