g********k 发帖数: 838 | 1 我在准备下周面试,主要是做forecasting的,之前学过一些方法,不过不系统。
网上搜了些,不过也不是特别明白。主要idea就是利用history data做分析,对吧?有
没有别的方法呢?谢啦 |
k****r 发帖数: 9629 | 2 这不是废话么,
不用history data难道看星象?
【在 g********k 的大作中提到】 : 我在准备下周面试,主要是做forecasting的,之前学过一些方法,不过不系统。 : 网上搜了些,不过也不是特别明白。主要idea就是利用history data做分析,对吧?有 : 没有别的方法呢?谢啦
|
g********k 发帖数: 838 | 3 据说所知,有些是要靠expert experience的。
大部分从history data来,不过怎么系统的来做呢? time series,regression,我只
是知道一些。
【在 k****r 的大作中提到】 : 这不是废话么, : 不用history data难道看星象?
|
c*******r 发帖数: 610 | 4 你说什么forecasting啊?Prediction? |
g********k 发帖数: 838 | 5 不一样吗,我感觉forecast和prediction是一个东东。。。
【在 c*******r 的大作中提到】 : 你说什么forecasting啊?Prediction?
|
c*******r 发帖数: 610 | 6 如果是prediction,那么我个人理解它只是数据挖掘的一个分支。 有很多已存在的挖掘
算法可以用来做prediction. 数据挖掘和机器学习以及统计等多个学科关系紧密。
看数据类型以及具体问题的context,通常有supervised learning(SL), unsupervised
learning (USL). SL 是基于有些已经分好类的数据建立一个模型,然后对未知数据进
行分类,也就是prediction, 有很多算法了,比如naive bayes, logistic
regression(名字是regression, 但是是supervised分类)Bayesian networks,
random forests (stochastic gradient descent random forest), knn, decision
tree, ....(太多了);USL的训练数据没有提前分好类,需要通过一些模型来把数据分
到不同的group中。很多算法比如k-means clustering之类的。
还有很多高深算法比如什么Conditional Random Fields, HMM之类的。 什么deep
learning之类的。
我也只知道皮毛。 反正就是一条:从历史数据里学习一个合适的模型,这个模型可能
有一些参数,然后对未知数据进行预测。 有些问题可能需要domain knowledge才能给
初始数据分类。
如果不是去面试data scientist或者ML specialist,我想一般不太会问到这些吧
【在 g********k 的大作中提到】 : 不一样吗,我感觉forecast和prediction是一个东东。。。
|
h******s 发帖数: 3420 | 7 k-means clustering 不是用来做分类的吗?能做PREDICTION?数学原理不象啊。可能
我理解不对。你这列的好多是CLASSIFICATION 啊。CS 这块做分类是很强,做预测还是
统计的好。
我知道的几个公司就是用TIME SERIES 和 REGRESSION.
unsupervised |
g********k 发帖数: 838 | 8 对,我的问题也是想请教forecast的系统方法,分类(classification)用的不多。
我好好复习下time series和regression。
【在 h******s 的大作中提到】 : k-means clustering 不是用来做分类的吗?能做PREDICTION?数学原理不象啊。可能 : 我理解不对。你这列的好多是CLASSIFICATION 啊。CS 这块做分类是很强,做预测还是 : 统计的好。 : 我知道的几个公司就是用TIME SERIES 和 REGRESSION. : unsupervised
|
g*********e 发帖数: 14401 | |
r*******k 发帖数: 1423 | 10 各种regression吧
SVR
【在 g********k 的大作中提到】 : 不一样吗,我感觉forecast和prediction是一个东东。。。
|
g********k 发帖数: 838 | 11 恩,谢谢。
SVR是什么?
【在 r*******k 的大作中提到】 : 各种regression吧 : SVR
|
g********k 发帖数: 838 | 12 我说的不是这些queueing theory的东西。
【在 g*********e 的大作中提到】 : 随机过程: : 高斯过程 维纳过程 白努力过程
|
z****e 发帖数: 54598 | 13 多数都是统计上的理论
除了数据本身以外
log mining还比较有用
尤其用来提高客户体验 |
h*******e 发帖数: 1377 | 14 。。。建模然后预测,有非linear 的 choatic 模型,还有linear 模型之类的。
话说文艺复兴基金hire一帮lingustic 还有物理学家数学家什么的 就是因为lingustic
经常通过前言预测后语。 |