b*****k 发帖数: 483 | 1 我不是Data Science方向的出身,但是接手了一个新项目,就是训练一个模型来通过一
些用户体态信息来预测用户满意度。
目前的数据非常单一,主观而且noisy:
500个用户的数据,包括3D扫描的人体几何信息(身高,体重,胸围,腰围,肩宽。。
。)以及一些简单的问卷调查,比如是否喜欢运动,流汗是否多等等。
最后要求这些用户试穿10种不同的衣服,然后自己打一个分数0~100代表自己的满意度。
我以前用deep learning做过一些定义明确的人脸识别啊,图片分类啊这种项目,但是
感觉这次的Data实在是太noisy了,而且用户满意度还是非常主观的metric(比如我几
天喜欢紧身衣,明天我就改主意喜欢宽松一点的了),用一个简单deep learning做
classification,预测的效果非常非常差。。。
请问这种现实问题有什么主流的data science方法可以用吗?恳请各位老师指点迷津。 |
m*****n 发帖数: 3575 | 2 应该就喜欢某项衣服的做SVM。就像你说的,不同衣服适合不同人。 |
b*****k 发帖数: 483 | 3 多谢大侠回复。是不是相比neural network,SVM更防噪音数据?
在网上一顿搜,搜到一个CBC (Choice based Conjoint)的概念,还有和SVM合在一块儿
用的方法,我基础太弱,读了几遍没太读懂,请问您了解CBC+SVM这方面吗?
BTW,我对SVM做过一些小实验,就是2分类器这种,目前对于如何应用到这个问题里还是
有些模糊。。。
【在 m*****n 的大作中提到】 : 应该就喜欢某项衣服的做SVM。就像你说的,不同衣服适合不同人。
|
c*****m 发帖数: 1160 | 4
度。
简单地说,应该有十万以上的数据,才好意思用 deep learning 的方式来做;现在你
只有500个,当然很难; 比如你用400个去做training ,然后拿100个做testing ,可
是那400个根本就不能cover这100个 sample,所以得到的结果肯定很差。
【在 b*****k 的大作中提到】 : 我不是Data Science方向的出身,但是接手了一个新项目,就是训练一个模型来通过一 : 些用户体态信息来预测用户满意度。 : 目前的数据非常单一,主观而且noisy: : 500个用户的数据,包括3D扫描的人体几何信息(身高,体重,胸围,腰围,肩宽。。 : 。)以及一些简单的问卷调查,比如是否喜欢运动,流汗是否多等等。 : 最后要求这些用户试穿10种不同的衣服,然后自己打一个分数0~100代表自己的满意度。 : 我以前用deep learning做过一些定义明确的人脸识别啊,图片分类啊这种项目,但是 : 感觉这次的Data实在是太noisy了,而且用户满意度还是非常主观的metric(比如我几 : 天喜欢紧身衣,明天我就改主意喜欢宽松一点的了),用一个简单deep learning做 : classification,预测的效果非常非常差。。。
|