多个分类器怎么融合？ - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 多个分类器怎么融合？

相关主题
● 请问有没有这种神经网络节点	● 关于正交向量(orthogonal vectors)的算法
● 对人的训练就像训练神经网络	● 如何在binary 矩阵中检索汉明码重？
● 问个关于随机数生成器的问题	● 问个矩阵问题
● c++11很不错，变化很大，现在有人开始用在实际项目里了吗	● [合集] Flash vs. Javascript
● 大家来看看这个纯Javascript实现的QR二维码生成器	● STL/vector引用成员变量。
● 请教个rng的问题	● 有什么软件包可以解这种优化问题？
● 擦 newsletter又有typo了	● C++编程问题：union inside struct
● GCC 居然允许变量长度的向量	● 这该是什么统计术语？

相关话题的讨论汇总
话题: 分类器话题: c1话题: 训练话题: c2话题: br

进入Programming版参与讨论

1

(共1页)

g*******u 发帖数: 3948	1 一堆数据训练了分类器 c1 c2 c3... 怎么融合为一个？比如训练了一个svm的训练了一个xgboost 训练了一个 randomforest的最后咋融合结果呢？最简单直接平均一下probs 输出有没有晒微高级并且鲁棒点的？谢谢
L****8 发帖数: 3938	2 把三个输入当做特征向量再训练一个神经网络【在 g*******u 的大作中提到】 : 一堆数据训练了分类器 c1 c2 c3... 怎么融合为一个？ : 比如训练了一个svm的训练了一个xgboost 训练了一个 randomforest的 : 最后咋融合结果呢？ : 最简单直接平均一下probs 输出 : 有没有晒微高级并且鲁棒点的？谢谢
g*******u 发帖数: 3948	3 我也这么想的先训练n个分类器，然后每个分类器作为一个feature生成器对每个样本输出一个prob 的特征连接起来然后训练一个总的对吧？有个问题比如有两个分类器c1 c2 对样本i c1的概率输出是 p1= [p_c1_0 p_c1_1] c1的概率输出是 p2=[p_c2_0 p_c2_1] 你意思吧p1 p2 stack起来形成一个特征向量进行训练？也就是[p1 p2] =[p_c1_0 p_c1_1 p_c2_0 p_c2_1] 如果这样的话一个问题是我有很多分类器比如有50个这样stack起来特征维数会很大啊比如50个分类器分类 20类别问题连接起来有1，000维度啊是不是特征维度会太大？还是我理解的有问题？谢谢【在 L****8 的大作中提到】 : 把三个输入当做特征向量再训练一个神经网络
g****t 发帖数: 31659	4 误差大的权重小所有的融合不能违背这个原理误差和权重的大小用什么数学技术衡量以及具体多大误差的分类器多少权重这取决于你要忽悠人还是自己用
g****t 发帖数: 31659	5 再次训练你的数据够吗…… 第二次训练数据比第一次少很多了吧数据不够不会有很多问题出来 : 我也这么想的 : 先训练n个分类器，然后每个分类器作为一个feature生成器对每个样本输出一个prob : 的特征连接起来然后训练一个总的对吧？ : 有个问题 : 比如有两个分类器c1 c2 : 对样本i c1的概率输出是 p1= [p_c1_0 p_c1_1] : c1的概率输出是 p2=[p_c2_0 p_c2_1] : 你意思吧p1 p2 stack起来形成一个特征向量进行训练？ : 也就是[p1 p2] =[p_c1_0 p_c1_1 p_c2_0 p_c2_1] : 如果这样的话一个问题是我有很多分类器比如有50个这样stack起来特征维数会【在 g*******u 的大作中提到】 : 我也这么想的 : 先训练n个分类器，然后每个分类器作为一个feature生成器对每个样本输出一个prob : 的特征连接起来然后训练一个总的对吧？ : 有个问题 : 比如有两个分类器c1 c2 : 对样本i c1的概率输出是 p1= [p_c1_0 p_c1_1] : c1的概率输出是 p2=[p_c2_0 p_c2_1] : 你意思吧p1 p2 stack起来形成一个特征向量进行训练？ : 也就是[p1 p2] =[p_c1_0 p_c1_1 p_c2_0 p_c2_1] : 如果这样的话一个问题是我有很多分类器比如有50个这样stack起来特征维数会
g*******u 发帖数: 3948	6 当然自己用了啊感觉直接vote或者 average是不是也就差不多了先训练 50个分类器然后再用同样数据继续训练一共就那些个数据【在 g****t 的大作中提到】 : 误差大的权重小 : 所有的融合不能违背这个原理 : 误差和权重的大小用什么数学技术衡量 : 以及具体多大误差的分类器多少权重 : 这取决于你要忽悠人还是自己用
g****t 发帖数: 31659	7 那就误差的均方差的倒数当权值。加权平均试试看。 : 当然自己用了啊 : 感觉直接vote或者 average是不是也就差不多了 : 先训练 50个分类器 : 然后再用同样数据继续训练 : 一共就那些个数据【在 g*******u 的大作中提到】 : 当然自己用了啊 : 感觉直接vote或者 average是不是也就差不多了 : 先训练 50个分类器 : 然后再用同样数据继续训练 : 一共就那些个数据
n******g 发帖数: 2201	8 random forest n_tree = 100 的时候就是简单平均吧【在 g*******u 的大作中提到】 : 当然自己用了啊 : 感觉直接vote或者 average是不是也就差不多了 : 先训练 50个分类器 : 然后再用同样数据继续训练 : 一共就那些个数据

1

(共1页)

进入Programming版参与讨论

相关主题
● 这该是什么统计术语？	● 大家来看看这个纯Javascript实现的QR二维码生成器
● matlab中xlswrite的使用	● 请教个rng的问题
● [合集] 请问一下题目的解决答案	● 擦 newsletter又有typo了
● 一个quadratic programming的问题，请指教！	● GCC 居然允许变量长度的向量
● 请问有没有这种神经网络节点	● 关于正交向量(orthogonal vectors)的算法
● 对人的训练就像训练神经网络	● 如何在binary 矩阵中检索汉明码重？
● 问个关于随机数生成器的问题	● 问个矩阵问题
● c++11很不错，变化很大，现在有人开始用在实际项目里了吗	● [合集] Flash vs. Javascript

相关话题的讨论汇总
话题: 分类器话题: c1话题: 训练话题: c2话题: br

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)