i******t 发帖数: 22541 | 1 假设我在做图片的 分类问题
假设识别猫
我的训练样本 只知道 此图是1 还是 -1
我不知道 猫具体在那里? 具体多大? 也就是说我的训练样本 没有猫 的具体的
位置和大小信息。 猫可能是 在边也可能是在中间 , 可以比较大 整个图像,
也可能比较小 , 也可能多个猫
这样的 训练样本 如何搞特征呢?
谢谢讨论 |
w***g 发帖数: 5958 | 2 faster RCNN?
我没用过这个,用的好回来汇报一下。
我都会手工画bounding box然后用FCN。
【在 i******t 的大作中提到】 : 假设我在做图片的 分类问题 : 假设识别猫 : 我的训练样本 只知道 此图是1 还是 -1 : 我不知道 猫具体在那里? 具体多大? 也就是说我的训练样本 没有猫 的具体的 : 位置和大小信息。 猫可能是 在边也可能是在中间 , 可以比较大 整个图像, : 也可能比较小 , 也可能多个猫 : 这样的 训练样本 如何搞特征呢? : 谢谢讨论
|
i******t 发帖数: 22541 | 3 我抽象了以下让大家有个具体例子而已。
我实际的问题是这个 “猫”本身 也不太好界定。
我的训练集合是时间序列。每一段时间序列比如2分钟。
我们只能标注这段序列感兴趣, 或者没兴趣。 也就是说我们不确定“猫”具体在那
里。
类似于我们做图象分类,标注的数据 只知道 这个图片包含 "猫"。but不知道
猫具体在那里。
换句话说 实际上是对这个问题本身的认识还有局限性, 不能做类似于bounding box
之类的 标注。这样的话 cnn或者变种能不能搞? 当初想的是, 既然特征不好
提取 能不能让cnn帮着提取。。
【在 w***g 的大作中提到】 : faster RCNN? : 我没用过这个,用的好回来汇报一下。 : 我都会手工画bounding box然后用FCN。
|
C*****5 发帖数: 8812 | 4 如果只是猫的话dlib就能做
【在 w***g 的大作中提到】 : faster RCNN? : 我没用过这个,用的好回来汇报一下。 : 我都会手工画bounding box然后用FCN。
|
w***g 发帖数: 5958 | 5 我理解错了。你并不想找猫在哪里,而是直接想对整个图片提取猫的特征。
如果你的标签只有0和1,那么你能得到的其实也就每个图片一个0-1之间的分数。
你可以硬把CNN倒数第二层作为特征,但这个特征除了预测0/1以外应该没太大用处。
如果你想用特征来做别的,比如找相似对象等,那么训练的时候得加入别的信息。
box
【在 i******t 的大作中提到】 : 我抽象了以下让大家有个具体例子而已。 : 我实际的问题是这个 “猫”本身 也不太好界定。 : 我的训练集合是时间序列。每一段时间序列比如2分钟。 : 我们只能标注这段序列感兴趣, 或者没兴趣。 也就是说我们不确定“猫”具体在那 : 里。 : 类似于我们做图象分类,标注的数据 只知道 这个图片包含 "猫"。but不知道 : 猫具体在那里。 : 换句话说 实际上是对这个问题本身的认识还有局限性, 不能做类似于bounding box : 之类的 标注。这样的话 cnn或者变种能不能搞? 当初想的是, 既然特征不好 : 提取 能不能让cnn帮着提取。。
|
i******t 发帖数: 22541 | 6 我当时就这么想的直接cnn 弄
就是不知道 这个情况下 效果如何
只能试试看拉。 caffe把1d信号当作图像用应该是一样的把,只有x方向 y
大小为1?
【在 w***g 的大作中提到】 : 我理解错了。你并不想找猫在哪里,而是直接想对整个图片提取猫的特征。 : 如果你的标签只有0和1,那么你能得到的其实也就每个图片一个0-1之间的分数。 : 你可以硬把CNN倒数第二层作为特征,但这个特征除了预测0/1以外应该没太大用处。 : 如果你想用特征来做别的,比如找相似对象等,那么训练的时候得加入别的信息。 : : box
|
s********k 发帖数: 6180 | 7 input之后接上CNN,不过CNN出来之后不接入FC和softmax,直接用SVM作binary 分类?
【在 i******t 的大作中提到】 : 假设我在做图片的 分类问题 : 假设识别猫 : 我的训练样本 只知道 此图是1 还是 -1 : 我不知道 猫具体在那里? 具体多大? 也就是说我的训练样本 没有猫 的具体的 : 位置和大小信息。 猫可能是 在边也可能是在中间 , 可以比较大 整个图像, : 也可能比较小 , 也可能多个猫 : 这样的 训练样本 如何搞特征呢? : 谢谢讨论
|
i******t 发帖数: 22541 | 8 大侠不是说过吗? 忘记哪个大侠了 要上就上xgboost
【在 s********k 的大作中提到】 : input之后接上CNN,不过CNN出来之后不接入FC和softmax,直接用SVM作binary 分类?
|
C*****5 发帖数: 8812 | 9 tabular data 上xgboost。这种 time series前后关联的用rnn好点
【在 i******t 的大作中提到】 : 大侠不是说过吗? 忘记哪个大侠了 要上就上xgboost
|
s********k 发帖数: 6180 | 10 time series确实上RNN可以一试,还有一种办法就是把time series做成embedding,有
些情况下效果也很好,计算量小很多
【在 C*****5 的大作中提到】 : tabular data 上xgboost。这种 time series前后关联的用rnn好点
|
i******t 发帖数: 22541 | 11 time series做成embedding是什么意思?
【在 s********k 的大作中提到】 : time series确实上RNN可以一试,还有一种办法就是把time series做成embedding,有 : 些情况下效果也很好,计算量小很多
|
s********k 发帖数: 6180 | 12 time series理解成序列,word2vec这种embedding就是把句子当成词的序列来做,你的
问题可能也能这样做,求每个entity的embedding
【在 i******t 的大作中提到】 : time series做成embedding是什么意思?
|