由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 请教一下如何做衣服款式客户满意度的regression?
进入DataSciences版参与讨论
1 (共1页)
b*****k
发帖数: 483
1
我不是Data Science方向的出身,但是接手了一个新项目,就是训练一个模型来通过一
些用户体态信息来预测用户满意度。
目前的数据非常单一,主观而且noisy:
500个用户的数据,包括3D扫描的人体几何信息(身高,体重,胸围,腰围,肩宽。。
。)以及一些简单的问卷调查,比如是否喜欢运动,流汗是否多等等。
最后要求这些用户试穿10种不同的衣服,然后自己打一个分数0~100代表自己的满意度。
我以前用deep learning做过一些定义明确的人脸识别啊,图片分类啊这种项目,但是
感觉这次的Data实在是太noisy了,而且用户满意度还是非常主观的metric(比如我几
天喜欢紧身衣,明天我就改主意喜欢宽松一点的了),用一个简单deep learning做
classification,预测的效果非常非常差。。。
请问这种现实问题有什么主流的data science方法可以用吗?恳请各位老师指点迷津。
m*****n
发帖数: 3575
2
应该就喜欢某项衣服的做SVM。就像你说的,不同衣服适合不同人。
b*****k
发帖数: 483
3
多谢大侠回复。是不是相比neural network,SVM更防噪音数据?
在网上一顿搜,搜到一个CBC (Choice based Conjoint)的概念,还有和SVM合在一块儿
用的方法,我基础太弱,读了几遍没太读懂,请问您了解CBC+SVM这方面吗?
BTW,我对SVM做过一些小实验,就是2分类器这种,目前对于如何应用到这个问题里还是
有些模糊。。。

【在 m*****n 的大作中提到】
: 应该就喜欢某项衣服的做SVM。就像你说的,不同衣服适合不同人。
c*****m
发帖数: 1160
4

度。
简单地说,应该有十万以上的数据,才好意思用 deep learning 的方式来做;现在你
只有500个,当然很难; 比如你用400个去做training ,然后拿100个做testing ,可
是那400个根本就不能cover这100个 sample,所以得到的结果肯定很差。

【在 b*****k 的大作中提到】
: 我不是Data Science方向的出身,但是接手了一个新项目,就是训练一个模型来通过一
: 些用户体态信息来预测用户满意度。
: 目前的数据非常单一,主观而且noisy:
: 500个用户的数据,包括3D扫描的人体几何信息(身高,体重,胸围,腰围,肩宽。。
: 。)以及一些简单的问卷调查,比如是否喜欢运动,流汗是否多等等。
: 最后要求这些用户试穿10种不同的衣服,然后自己打一个分数0~100代表自己的满意度。
: 我以前用deep learning做过一些定义明确的人脸识别啊,图片分类啊这种项目,但是
: 感觉这次的Data实在是太noisy了,而且用户满意度还是非常主观的metric(比如我几
: 天喜欢紧身衣,明天我就改主意喜欢宽松一点的了),用一个简单deep learning做
: classification,预测的效果非常非常差。。。

1 (共1页)
进入DataSciences版参与讨论