d****n 发帖数: 12461 | 1 例如url mining, log mining,本身这个url的写法,就是“茴”字有几种写法的问题
,amazon有amazon的写法,twitter有twitter的写法,然后海派工程师习惯用英文,土
派工程师喜欢拼音...最后再加点sessionid,ref之类的信息,已经够乱了。而且根本不
知道6个月以后amazon是不是还是一样的写法。这就造成了算法跟不上数据的变化。
又例如图像mining,如果都是天文望远镜拍摄的图像,那当然好了。现在例如要做
pinterest的mining,这下好了,除了大小一样以外基本上就没有一致的东西。
这最后造成一个问题,就是现在做big data platform和story的远远大于解决有意义问
题的。 |
a***r 发帖数: 2677 | |
g****l 发帖数: 213 | 3 楼上的亲们,大数据或者说数据分析一定是要有business case 下的分析,永远没有正确
的model 也不需要十全十美的model,在商业上有用,提高了profit, response rate
就是好model (逼着我想到了黑猫白猫论)
咱们的科学家们能不能接点地气? |
w*****m 发帖数: 20421 | |
d*****n 发帖数: 754 | 5 看结果。如果没用,公司会裁掉的。但决策是需要这些东西的。看看大公司养了多少人
专门做报表。
【在 a***r 的大作中提到】 : 数据科学包括所谓的统计都是寄生科学,忽悠科学。
|
d****n 发帖数: 12461 | |
d****n 发帖数: 12461 | |