m**********4 发帖数: 774 | 1 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
在实际中用起来风险很大..
不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
那PROFIT MARGIN很快就会消失了吧。。
我的想法很幼稚,希望有这方面经验的大牛指点一下。 |
a*******1 发帖数: 1554 | 2 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
-sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
parameter然后用linear regression/svm选significant的出来。。。
请拍砖。。。 |
L*******t 发帖数: 2385 | 3 Finance paper里面的linear models是啥模型?
你看过的paper,
能否给个链接啊?
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
m**********4 发帖数: 774 | 4 It is not out-of sample, of course.
Generally, it is not used for prediction. It is used for explanation.
你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为
,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我
还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看
到这些price prediction 文章用到的features都是我们能想到的。。。
从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work
on it。
of
【在 a*******1 的大作中提到】 : 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of : -sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准 : 。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆 : parameter然后用linear regression/svm选significant的出来。。。 : 请拍砖。。。
|
m**********4 发帖数: 774 | 5 variations of linear regression...
我找找然后贴上来啊。现在手头没有。。。
【在 L*******t 的大作中提到】 : Finance paper里面的linear models是啥模型? : 你看过的paper, : 能否给个链接啊? : : finance
|
z******o 发帖数: 1224 | 6 Fienberg的学生? what kind of topic you did in ML?
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
s*******n 发帖数: 631 | 7 ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理.
这个有原因么?
貌似一些NLP还是有些进展的,在与人打交道的领域? |
m**********4 发帖数: 774 | 8 NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
研究都有结果,很多所谓的结果对生产也没有意义。
我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
,那哪里来的profit呢。欢迎大牛指点。
【在 s*******n 的大作中提到】 : ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理. : 这个有原因么? : 貌似一些NLP还是有些进展的,在与人打交道的领域?
|
s******a 发帖数: 472 | 9 华尔街用的都是很简单的东西
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
L*******t 发帖数: 2385 | 10 金融里面有一些市场假设,现在很多人在吐血验证中
其中一个假说就是有效市场假说,一旦被验证成立,那么任何通过历史价格获取信息的
交易策略都将是徒劳的。
但是现实是还是有一些pattern存在,可能就是你说的features。人们有各种认知偏差
,交易习惯也会造成种种的pattern。比如交易量在一天内中午是较小的因为大家都去
吃饭了-.-..
我觉得现在的Pattern recognition应该从行为金融学的角度去发掘金融市场的
patterns,也就是行为金融里面说的种种效应。
Curve fitting在确定性问题中应该有很好的解,但是市场不一定总是理性,而且curve
一不一定就有很明显的pattern。所以预测始终是一个很难得问题。也没有模型总是有
效。
而且在时间尺度上说,不同的scale性质就大不一样了。。
data
predictable
【在 m**********4 的大作中提到】 : NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。 : 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data : 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西 : 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision : support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研 : 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数 : 研究都有结果,很多所谓的结果对生产也没有意义。 : 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable : ,那哪里来的profit呢。欢迎大牛指点。
|
|
|
L*******t 发帖数: 2385 | 11 小白继续说。。
而且很多实证都表明,存在overfit的现象。在做研究的时候很多人都选择了模型表现
最好的
一段数据去发表结果。。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
w*********0 发帖数: 48 | 12 machine learning和其他所有类似研究的人
都是有选择性的发表结果
虽然不是作假,但是和有偏向性的报道一样
即使能做到all but the truth(已经算是难得了),也做不到all the truth
如果他们的模型这么有效,
他们首先想到的绝不是发表,而是用这个去赚钱去了 |
L*******t 发帖数: 2385 | 13 而且金融里用的一些识别pattern的模型都很简单实用。。
可能你看了会笑。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
k*******d 发帖数: 1340 | 14 呼唤weekendsunny
我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
的如果可以predict出来也好啊 |
L*******t 发帖数: 2385 | 15 Vol的可预测度就高多了。比起mean return来。
也有人做过Price和VOl的联合建模,发表在JF上了。。
【在 k*******d 的大作中提到】 : 呼唤weekendsunny : 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类 : 的如果可以predict出来也好啊
|
l**********e 发帖数: 336 | 16 如果要看machine learning的应用,不理解为什么看statistics,或者R^2。ML就是因
为比传统的statistics在实际中更能处理复杂的数据,比传统的pattten recognition
更有理论基础,等理由而热起来的
NLP,Speech Recognition,Information Retrieval,Computer Vision,bioinfo这些
应用领域或多或少ML都取得了一些有意思的进展
处理实际问题,提取feature+用现成的package只是一种比较省事的方法,很多时候太
局限了。真要解决问题,还是需要针对问题去建模分析怎样用做合适,自己提model,
甚至自己coding实现
work
【在 m**********4 的大作中提到】 : It is not out-of sample, of course. : Generally, it is not used for prediction. It is used for explanation. : 你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为 : ,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我 : 还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看 : 到这些price prediction 文章用到的features都是我们能想到的。。。 : 从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work : on it。 : : of
|
s*******n 发帖数: 631 | 17
data
predictable
ML在金融和互联网领域的应用还是有些可以的
我肤浅的理解,ML其实就一些Learning的algorithm
基于现在有的数据/信息,预测未来的可能性
这个逻辑就决定了一定是有局限的
而且只能事后验证
现在互联网做的data product或者online marketing
基本上都是基于ML的吧
有些的确还是不错的,从实践角度来看
如果直接用data做商业decision或者支持decision
这个应该属于BI领域吧
也已经有了很久了
终究还是不能替代人做商业
这个不算局限吧
【在 m**********4 的大作中提到】 : NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。 : 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data : 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西 : 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision : support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研 : 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数 : 研究都有结果,很多所谓的结果对生产也没有意义。 : 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable : ,那哪里来的profit呢。欢迎大牛指点。
|
S*********g 发帖数: 5298 | 18 out of sample 0.05?
什么horizon的?
有0.05还能scale的话,
就坐着收钱了
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
S*********g 发帖数: 5298 | 19 最终你还是要换成对price的prediction才能做trade decision不是
【在 k*******d 的大作中提到】 : 呼唤weekendsunny : 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类 : 的如果可以predict出来也好啊
|
S*********g 发帖数: 5298 | 20 有些很简单的公式确实很管用,看r2的话out of sample在很短的时间段里是有1%左右
的、但是因为简单,知道的人也多,relization非常快,你要是用这些signal去trade
的话,基本上你还没排到前排信号就消失了。而这些信号往往不会大到值得去cross
market
【在 s******a 的大作中提到】 : 华尔街用的都是很简单的东西 : : finance
|
|
|
S*********g 发帖数: 5298 | 21 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
关键还有execution做的好一点,你就有钱赚。
细节决定成败,有时候一点小改进,你就可能有一阵子的大优势
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
s*******n 发帖数: 631 | 22
这个角度如果是针对HF还可以理解
对于所有的买方和portfolio管理
都是这样的话
这个行业就很困难啊
【在 S*********g 的大作中提到】 : 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多, : 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点, : 关键还有execution做的好一点,你就有钱赚。 : 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势 : : finance
|
L*******t 发帖数: 2385 | 23 业界怎么做optimizatio的呀?。。
能传授一下吗?。。
【在 S*********g 的大作中提到】 : 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多, : 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点, : 关键还有execution做的好一点,你就有钱赚。 : 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势 : : finance
|
b*********e 发帖数: 38 | 24 Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。 |
b*********e 发帖数: 38 | 25 这个行业的确很困难啊
【在 s*******n 的大作中提到】 : : 这个角度如果是针对HF还可以理解 : 对于所有的买方和portfolio管理 : 都是这样的话 : 这个行业就很困难啊
|
s*******n 发帖数: 631 | 26
我所理解的modeling
指的就是model整个系统和流程
至少据我所知西蒙斯就是搞这个
从data mining 到feature选择
到execution都是model化的
如果只是选择部分信息,发现零星机会
这种还不如直接赌命
现在的情况是,没有能够够搞定
这么系统化的model和data
以及如何维护这个model
从现在来看,整体上quant model
表现实际上真心不如其他fundamental的
【在 b*********e 的大作中提到】 : Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学 : 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就 : 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候 : ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型 : 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。
|
L*******t 发帖数: 2385 | 27 可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。
我觉得两者的结合是未来的方向
【在 s*******n 的大作中提到】 : : 我所理解的modeling : 指的就是model整个系统和流程 : 至少据我所知西蒙斯就是搞这个 : 从data mining 到feature选择 : 到execution都是model化的 : 如果只是选择部分信息,发现零星机会 : 这种还不如直接赌命 : 现在的情况是,没有能够够搞定 : 这么系统化的model和data
|
s*******n 发帖数: 631 | 28
Fundamental不能完胜也没有取代quant的意思
(从历史来看,有人希望quant取代fundamental倒是真的)
但是,Fundamental注重logical relationship
而不是fancy的model,以至无法解释和控制
不是每个Fundamental都能真正解释复杂的市场
所以,不是每个Fundamental都能取得好的结果
【在 L*******t 的大作中提到】 : 可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。 : 我觉得两者的结合是未来的方向
|
L*******t 发帖数: 2385 | 29 还是觉得两者要结合。
总是通过历史数据预测未来,就像看后视镜开车一样。
当然,两者结合也不一定能预测得好。。
【在 s*******n 的大作中提到】 : : Fundamental不能完胜也没有取代quant的意思 : (从历史来看,有人希望quant取代fundamental倒是真的) : 但是,Fundamental注重logical relationship : 而不是fancy的model,以至无法解释和控制 : 不是每个Fundamental都能真正解释复杂的市场 : 所以,不是每个Fundamental都能取得好的结果
|
w**********y 发帖数: 1691 | 30 Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
strategy".
我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
correlation...)
HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
【在 S*********g 的大作中提到】 : out of sample 0.05? : 什么horizon的? : 有0.05还能scale的话, : 就坐着收钱了 : : finance
|
|
|
s*******n 发帖数: 631 | 31
借问行业中真正的标准是啥
如果不用model选择的标准的话?
如何选择strategy呢?
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
S*********g 发帖数: 5298 | 32 能赚钱是唯一标准
R^2最好的setup不一定是最能赚钱的。
因为R^2是个理论值,
它不考虑risk distribution,constraint,以及slippage等
【在 s*******n 的大作中提到】 : : 借问行业中真正的标准是啥 : 如果不用model选择的标准的话? : 如何选择strategy呢?
|
S*********g 发帖数: 5298 | 33 看你是在什么horizon了
fundamental model和techinical model各自有各自的强项
其实fundamental model和quantitative model不排斥
现在有不少fundamental model是全自动quantitative的
基于news的model也可以是全自动quantitative的
【在 s*******n 的大作中提到】 : : 借问行业中真正的标准是啥 : 如果不用model选择的标准的话? : 如何选择strategy呢?
|
S*********g 发帖数: 5298 | 34 0.2 correlation的,R^2也不错了,也有0.04了
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
M*******i 发帖数: 82 | 35 什么universe/horizon能有20% correlation阿
大侠给个paper的link?
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
k*******d 发帖数: 1340 | 36 弱弱地问一下这里R^2的准确定义是什么啊?某个东西的variance?
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
n****n 发帖数: 59 | 37 ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实
和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话,
但是两方面相辅相成,相生相克。 |
s*******s 发帖数: 1568 | 38 personally I don't like any fitting/ml based model, try to use R^2 to
measure how good it is all the time. The most profitable strategies I saw
never use any stats/ml techniques, just purely derived from market intuition.
my two cent.
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
s*******n 发帖数: 631 | 39
能赚钱这个标准当然是
关键这个是事后的标准
在做决策时候的标准是啥?
【在 S*********g 的大作中提到】 : 能赚钱是唯一标准 : R^2最好的setup不一定是最能赚钱的。 : 因为R^2是个理论值, : 它不考虑risk distribution,constraint,以及slippage等
|
S*********g 发帖数: 5298 | 40 rigorous in-sample/out-sample back testing
【在 s*******n 的大作中提到】 : : 能赚钱这个标准当然是 : 关键这个是事后的标准 : 在做决策时候的标准是啥?
|
|
|
S*********g 发帖数: 5298 | 41 不矛盾,好多好用的quant model都是有很好的market intuition的
quant model可以帮你把intuition量化,做严格的back testing
intuition.
【在 s*******s 的大作中提到】 : personally I don't like any fitting/ml based model, try to use R^2 to : measure how good it is all the time. The most profitable strategies I saw : never use any stats/ml techniques, just purely derived from market intuition. : my two cent.
|
J*****n 发帖数: 4859 | 42 我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么? |
s*******n 发帖数: 631 | 43
quant model可以帮你把intuition量化?
确定可以做到么?
【在 S*********g 的大作中提到】 : 不矛盾,好多好用的quant model都是有很好的market intuition的 : quant model可以帮你把intuition量化,做严格的back testing : : intuition.
|
a*****e 发帖数: 1717 | 44 第一条从很多层面上不成立。
【在 n****n 的大作中提到】 : ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实 : 和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话, : 但是两方面相辅相成,相生相克。
|
S*********g 发帖数: 5298 | 45 举个最简单的例
AR model,或者pair trading
【在 s*******n 的大作中提到】 : : quant model可以帮你把intuition量化? : 确定可以做到么?
|
s*******n 发帖数: 631 | 46
这个我了解
关键是quant model不能完全准备表达
intuition
这是我的观点
【在 S*********g 的大作中提到】 : 举个最简单的例 : AR model,或者pair trading
|
S*********g 发帖数: 5298 | 47 不一定要实时算的
好多东西可以先算好,然后就做简单的matching
如果实在计算量大,可以并行计算
么?
【在 J*****n 的大作中提到】 : 我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么?
|
b*********e 发帖数: 38 | 48 这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便
在超高频见过这样的signal,基本上也是unscaleable.
现实总是残酷的
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
s*******s 发帖数: 1568 | 49 why? if you are doing pure arb/latency arb, correlation should close to 1.
Sharpe should be > 30 in production.
【在 b*********e 的大作中提到】 : 这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便 : 在超高频见过这样的signal,基本上也是unscaleable. : 现实总是残酷的
|
s*******s 发帖数: 1568 | 50 The problem was most of those strategies are hard to back tests...they are
trying to impact the market to make money. As far as know SPOT Trading lose
tons of money on trading futures due to a software glitch several years ago,
and they develop a very profitable strategy based on that --- impact the
market.
【在 S*********g 的大作中提到】 : 不矛盾,好多好用的quant model都是有很好的market intuition的 : quant model可以帮你把intuition量化,做严格的back testing : : intuition.
|
|
|
S*********g 发帖数: 5298 | 51 quant当然也不是万能的。寸有所长,尺有所短。
你这个strategy不叫predict market
是擦边球的manipuldate market吧
lose
ago,
【在 s*******s 的大作中提到】 : The problem was most of those strategies are hard to back tests...they are : trying to impact the market to make money. As far as know SPOT Trading lose : tons of money on trading futures due to a software glitch several years ago, : and they develop a very profitable strategy based on that --- impact the : market.
|
w**********y 发帖数: 1691 | 52 Isn't this the tricky part of Ultra HFT? Welcome to share more insiders'
views :)
When people mentioned R^2, that might be assumed to be a rough estimate of
predictability of the signal/predictive model. Frankly, the said 0.04 R^2
was from 2012 several months'out-of-sample test, with a medium trading
frequency. Impossible to be replicated in real life. Or why I need to put
that into a paper...
lose
ago,
【在 s*******s 的大作中提到】 : The problem was most of those strategies are hard to back tests...they are : trying to impact the market to make money. As far as know SPOT Trading lose : tons of money on trading futures due to a software glitch several years ago, : and they develop a very profitable strategy based on that --- impact the : market.
|
S*********g 发帖数: 5298 | 53 给个paper的link吧
【在 w**********y 的大作中提到】 : Isn't this the tricky part of Ultra HFT? Welcome to share more insiders' : views :) : When people mentioned R^2, that might be assumed to be a rough estimate of : predictability of the signal/predictive model. Frankly, the said 0.04 R^2 : was from 2012 several months'out-of-sample test, with a medium trading : frequency. Impossible to be replicated in real life. Or why I need to put : that into a paper... : : lose : ago,
|
d*******t 发帖数: 273 | 54 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
strategy能放production。 |
w**********y 发帖数: 1691 | 55 我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这
些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲
【在 S*********g 的大作中提到】 : quant当然也不是万能的。寸有所长,尺有所短。 : 你这个strategy不叫predict market : 是擦边球的manipuldate market吧 : : lose : ago,
|
w**********y 发帖数: 1691 | 56 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
paper 在优化上的一些步骤应该有问题...
【在 d*******t 的大作中提到】 : 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几 : 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个 : strategy能放production。
|
S*********g 发帖数: 5298 | 57 我是外行,没做过超高频的东西。
超高频的好像也确实不怎么需要我们quant
【在 w**********y 的大作中提到】 : 我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这 : 些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲
|
J*****n 发帖数: 4859 | 58
mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是
regression类型的model,注重预测未来。
我一直很好奇,有没有人把两种方法巧妙地结合起来用的?
还是这两种做法天生就是相克的?
【在 S*********g 的大作中提到】 : 我是外行,没做过超高频的东西。 : 超高频的好像也确实不怎么需要我们quant
|
S*********g 发帖数: 5298 | 59 1. I do not agree those are completely different. They are both predicting
price movement using historical pattern. Rule-based strategy typically works
on price while regression model typical works on return.
2.Trend-following used by typical CTA is just a very small subclass of rule-
based strategies. Most modern CTAs use strategies beyond trend-following.
3. Rule-based strategies can typically find supports in regression/
optimization results. For example, moving average trend-following/mean-
reversion is just an AR model (in price). Pricing formula can also be traced
back to an optimization outcome with some sort of risk assumption.
I heard Two-sigma uses forecast/optimization of different horizons in their
CTA program. But, their CTA program did not out-perform industry leaders
such as Winton.
QIM uses some kind of machine learning technique to choose from a large set
of rules.
【在 J*****n 的大作中提到】 : : mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是 : regression类型的model,注重预测未来。 : 我一直很好奇,有没有人把两种方法巧妙地结合起来用的? : 还是这两种做法天生就是相克的?
|
p****u 发帖数: 2596 | 60 学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。
【在 d*******t 的大作中提到】 : 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几 : 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个 : strategy能放production。
|
|
|
p****u 发帖数: 2596 | 61 这种算法的paper真的是编数据结果太容易拉,一般谁都没有办法去verify结果对不对.
【在 w**********y 的大作中提到】 : 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历. : 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇 : paper 在优化上的一些步骤应该有问题...
|
S*********g 发帖数: 5298 | 62 Isn't that part of the game to mislead your competitor and waste their man
power and time?
【在 p****u 的大作中提到】 : 学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。
|
H*T 发帖数: 43 | 63 不管什么样的model,都要tradeable,比如能beat交易成本。
各位有经验的说说,在做回测时,都用什么样的成本估计?对于
一个大的day order, 1bps above vwap reasonable? |
h****e 发帖数: 2125 | 64 这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊
【在 S*********g 的大作中提到】 : Isn't that part of the game to mislead your competitor and waste their man : power and time?
|
J*****n 发帖数: 4859 | 65
其实我觉得这些人是本末倒置。
应该是先有optimization的框架,然后往里面填策略。
而不是先有策略,然后再去找合适的optimization。
我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不
同之处。
【在 w**********y 的大作中提到】 : 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历. : 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇 : paper 在优化上的一些步骤应该有问题...
|
k***f 发帖数: 10 | 66
做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒
木头都会香。
【在 J*****n 的大作中提到】 : : 其实我觉得这些人是本末倒置。 : 应该是先有optimization的框架,然后往里面填策略。 : 而不是先有策略,然后再去找合适的optimization。 : 我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不 : 同之处。
|
J*****n 发帖数: 4859 | 67
你跟我抬这个杠有意思么?
你见过哪家公司,同类型的策略用不同的optimizer的?
【在 k***f 的大作中提到】 : : 做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒 : 木头都会香。
|
S*********g 发帖数: 5298 | 68 总会有各种泄密渠道的
特别是如果你是industry leader的话
【在 h****e 的大作中提到】 : 这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊
|
J*****n 发帖数: 4859 | 69
这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。
【在 S*********g 的大作中提到】 : 总会有各种泄密渠道的 : 特别是如果你是industry leader的话
|
k***f 发帖数: 10 | 70
世界之大,无奇不有。何况你谈论的情况一点也不稀奇。
【在 J*****n 的大作中提到】 : : 这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。
|
|
|
J*****n 发帖数: 4859 | 71
阁下倒是说些稀奇的,让我等也开开眼界。
【在 k***f 的大作中提到】 : : 世界之大,无奇不有。何况你谈论的情况一点也不稀奇。
|
S*********g 发帖数: 5298 | 72 真是服了你们了,什么都能吵起来
【在 J*****n 的大作中提到】 : : 阁下倒是说些稀奇的,让我等也开开眼界。
|
J*****n 发帖数: 4859 | 73
我说的也都是些稀松平常的东西。
既然这位高人说知道啥稀奇的东西,自然要请教一二。
【在 S*********g 的大作中提到】 : 真是服了你们了,什么都能吵起来
|
h********3 发帖数: 2075 | 74 其实计算机能做的事情也就帮助分析,比如快速计算相关性,关联性等等。至于这些结
果有没有用,还是得人来分析。也就是说,计算机只能在大规模数据计算上帮助人,但
是智能点的推理都是不靠谱的。
实际上除了现实里面大部分能用的就data mining。machine learning那么多炫的技术
可用的极少。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
h********3 发帖数: 2075 | 75 工业界都是简单模型。
【在 s******a 的大作中提到】 : 华尔街用的都是很简单的东西 : : finance
|
k****t 发帖数: 15 | 76
非常同意,很容易在细节上交学费,亏钱是小事,严重起来把桌子或公司搞倒都有可能
【在 b*********e 的大作中提到】 : Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学 : 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就 : 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候 : ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型 : 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。
|
x****m 发帖数: 1084 | 77 R2要是0.6几的话算好还是不好啊?大家都说0.04我搞糊涂了,我在学校的时候
用ANN做预测的,感觉结果好坏和数据的相关性太大了 |
S*******s 发帖数: 13043 | 78 any comments on their work?
【在 L*******t 的大作中提到】 : Vol的可预测度就高多了。比起mean return来。 : 也有人做过Price和VOl的联合建模,发表在JF上了。。
|
D*****a 发帖数: 2847 | 79 ML就是事后诸葛亮
啥都能fit
真要用,基本亏钱
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
m**********4 发帖数: 774 | 80 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
在实际中用起来风险很大..
不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
那PROFIT MARGIN很快就会消失了吧。。
我的想法很幼稚,希望有这方面经验的大牛指点一下。 |
|
|
a*******1 发帖数: 1554 | 81 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
-sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
parameter然后用linear regression/svm选significant的出来。。。
请拍砖。。。 |
L*******t 发帖数: 2385 | 82 Finance paper里面的linear models是啥模型?
你看过的paper,
能否给个链接啊?
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
m**********4 发帖数: 774 | 83 It is not out-of sample, of course.
Generally, it is not used for prediction. It is used for explanation.
你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为
,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我
还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看
到这些price prediction 文章用到的features都是我们能想到的。。。
从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work
on it。
of
【在 a*******1 的大作中提到】 : 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of : -sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准 : 。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆 : parameter然后用linear regression/svm选significant的出来。。。 : 请拍砖。。。
|
m**********4 发帖数: 774 | 84 variations of linear regression...
我找找然后贴上来啊。现在手头没有。。。
【在 L*******t 的大作中提到】 : Finance paper里面的linear models是啥模型? : 你看过的paper, : 能否给个链接啊? : : finance
|
z******o 发帖数: 1224 | 85 Fienberg的学生? what kind of topic you did in ML?
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
s*******n 发帖数: 631 | 86 ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理.
这个有原因么?
貌似一些NLP还是有些进展的,在与人打交道的领域? |
m**********4 发帖数: 774 | 87 NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
研究都有结果,很多所谓的结果对生产也没有意义。
我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
,那哪里来的profit呢。欢迎大牛指点。
【在 s*******n 的大作中提到】 : ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理. : 这个有原因么? : 貌似一些NLP还是有些进展的,在与人打交道的领域?
|
s******a 发帖数: 472 | 88 华尔街用的都是很简单的东西
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
L*******t 发帖数: 2385 | 89 金融里面有一些市场假设,现在很多人在吐血验证中
其中一个假说就是有效市场假说,一旦被验证成立,那么任何通过历史价格获取信息的
交易策略都将是徒劳的。
但是现实是还是有一些pattern存在,可能就是你说的features。人们有各种认知偏差
,交易习惯也会造成种种的pattern。比如交易量在一天内中午是较小的因为大家都去
吃饭了-.-..
我觉得现在的Pattern recognition应该从行为金融学的角度去发掘金融市场的
patterns,也就是行为金融里面说的种种效应。
Curve fitting在确定性问题中应该有很好的解,但是市场不一定总是理性,而且curve
一不一定就有很明显的pattern。所以预测始终是一个很难得问题。也没有模型总是有
效。
而且在时间尺度上说,不同的scale性质就大不一样了。。
data
predictable
【在 m**********4 的大作中提到】 : NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。 : 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data : 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西 : 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision : support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研 : 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数 : 研究都有结果,很多所谓的结果对生产也没有意义。 : 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable : ,那哪里来的profit呢。欢迎大牛指点。
|
L*******t 发帖数: 2385 | 90 小白继续说。。
而且很多实证都表明,存在overfit的现象。在做研究的时候很多人都选择了模型表现
最好的
一段数据去发表结果。。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
|
|
w*********0 发帖数: 48 | 91 machine learning和其他所有类似研究的人
都是有选择性的发表结果
虽然不是作假,但是和有偏向性的报道一样
即使能做到all but the truth(已经算是难得了),也做不到all the truth
如果他们的模型这么有效,
他们首先想到的绝不是发表,而是用这个去赚钱去了 |
L*******t 发帖数: 2385 | 92 而且金融里用的一些识别pattern的模型都很简单实用。。
可能你看了会笑。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
k*******d 发帖数: 1340 | 93 呼唤weekendsunny
我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
的如果可以predict出来也好啊 |
L*******t 发帖数: 2385 | 94 Vol的可预测度就高多了。比起mean return来。
也有人做过Price和VOl的联合建模,发表在JF上了。。
【在 k*******d 的大作中提到】 : 呼唤weekendsunny : 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类 : 的如果可以predict出来也好啊
|
l**********e 发帖数: 336 | 95 如果要看machine learning的应用,不理解为什么看statistics,或者R^2。ML就是因
为比传统的statistics在实际中更能处理复杂的数据,比传统的pattten recognition
更有理论基础,等理由而热起来的
NLP,Speech Recognition,Information Retrieval,Computer Vision,bioinfo这些
应用领域或多或少ML都取得了一些有意思的进展
处理实际问题,提取feature+用现成的package只是一种比较省事的方法,很多时候太
局限了。真要解决问题,还是需要针对问题去建模分析怎样用做合适,自己提model,
甚至自己coding实现
work
【在 m**********4 的大作中提到】 : It is not out-of sample, of course. : Generally, it is not used for prediction. It is used for explanation. : 你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为 : ,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我 : 还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看 : 到这些price prediction 文章用到的features都是我们能想到的。。。 : 从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work : on it。 : : of
|
s*******n 发帖数: 631 | 96
data
predictable
ML在金融和互联网领域的应用还是有些可以的
我肤浅的理解,ML其实就一些Learning的algorithm
基于现在有的数据/信息,预测未来的可能性
这个逻辑就决定了一定是有局限的
而且只能事后验证
现在互联网做的data product或者online marketing
基本上都是基于ML的吧
有些的确还是不错的,从实践角度来看
如果直接用data做商业decision或者支持decision
这个应该属于BI领域吧
也已经有了很久了
终究还是不能替代人做商业
这个不算局限吧
【在 m**********4 的大作中提到】 : NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。 : 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data : 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西 : 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision : support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研 : 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数 : 研究都有结果,很多所谓的结果对生产也没有意义。 : 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable : ,那哪里来的profit呢。欢迎大牛指点。
|
S*********g 发帖数: 5298 | 97 out of sample 0.05?
什么horizon的?
有0.05还能scale的话,
就坐着收钱了
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
S*********g 发帖数: 5298 | 98 最终你还是要换成对price的prediction才能做trade decision不是
【在 k*******d 的大作中提到】 : 呼唤weekendsunny : 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类 : 的如果可以predict出来也好啊
|
S*********g 发帖数: 5298 | 99 有些很简单的公式确实很管用,看r2的话out of sample在很短的时间段里是有1%左右
的、但是因为简单,知道的人也多,relization非常快,你要是用这些signal去trade
的话,基本上你还没排到前排信号就消失了。而这些信号往往不会大到值得去cross
market
【在 s******a 的大作中提到】 : 华尔街用的都是很简单的东西 : : finance
|
S*********g 发帖数: 5298 | 100 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
关键还有execution做的好一点,你就有钱赚。
细节决定成败,有时候一点小改进,你就可能有一阵子的大优势
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
|
|
s*******n 发帖数: 631 | 101
这个角度如果是针对HF还可以理解
对于所有的买方和portfolio管理
都是这样的话
这个行业就很困难啊
【在 S*********g 的大作中提到】 : 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多, : 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点, : 关键还有execution做的好一点,你就有钱赚。 : 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势 : : finance
|
L*******t 发帖数: 2385 | 102 业界怎么做optimizatio的呀?。。
能传授一下吗?。。
【在 S*********g 的大作中提到】 : 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多, : 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点, : 关键还有execution做的好一点,你就有钱赚。 : 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势 : : finance
|
b*********e 发帖数: 38 | 103 Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。 |
b*********e 发帖数: 38 | 104 这个行业的确很困难啊
【在 s*******n 的大作中提到】 : : 这个角度如果是针对HF还可以理解 : 对于所有的买方和portfolio管理 : 都是这样的话 : 这个行业就很困难啊
|
s*******n 发帖数: 631 | 105
我所理解的modeling
指的就是model整个系统和流程
至少据我所知西蒙斯就是搞这个
从data mining 到feature选择
到execution都是model化的
如果只是选择部分信息,发现零星机会
这种还不如直接赌命
现在的情况是,没有能够够搞定
这么系统化的model和data
以及如何维护这个model
从现在来看,整体上quant model
表现实际上真心不如其他fundamental的
【在 b*********e 的大作中提到】 : Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学 : 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就 : 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候 : ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型 : 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。
|
L*******t 发帖数: 2385 | 106 可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。
我觉得两者的结合是未来的方向
【在 s*******n 的大作中提到】 : : 我所理解的modeling : 指的就是model整个系统和流程 : 至少据我所知西蒙斯就是搞这个 : 从data mining 到feature选择 : 到execution都是model化的 : 如果只是选择部分信息,发现零星机会 : 这种还不如直接赌命 : 现在的情况是,没有能够够搞定 : 这么系统化的model和data
|
s*******n 发帖数: 631 | 107
Fundamental不能完胜也没有取代quant的意思
(从历史来看,有人希望quant取代fundamental倒是真的)
但是,Fundamental注重logical relationship
而不是fancy的model,以至无法解释和控制
不是每个Fundamental都能真正解释复杂的市场
所以,不是每个Fundamental都能取得好的结果
【在 L*******t 的大作中提到】 : 可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。 : 我觉得两者的结合是未来的方向
|
L*******t 发帖数: 2385 | 108 还是觉得两者要结合。
总是通过历史数据预测未来,就像看后视镜开车一样。
当然,两者结合也不一定能预测得好。。
【在 s*******n 的大作中提到】 : : Fundamental不能完胜也没有取代quant的意思 : (从历史来看,有人希望quant取代fundamental倒是真的) : 但是,Fundamental注重logical relationship : 而不是fancy的model,以至无法解释和控制 : 不是每个Fundamental都能真正解释复杂的市场 : 所以,不是每个Fundamental都能取得好的结果
|
w**********y 发帖数: 1691 | 109 Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
strategy".
我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
correlation...)
HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
【在 S*********g 的大作中提到】 : out of sample 0.05? : 什么horizon的? : 有0.05还能scale的话, : 就坐着收钱了 : : finance
|
s*******n 发帖数: 631 | 110
借问行业中真正的标准是啥
如果不用model选择的标准的话?
如何选择strategy呢?
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
|
|
S*********g 发帖数: 5298 | 111 能赚钱是唯一标准
R^2最好的setup不一定是最能赚钱的。
因为R^2是个理论值,
它不考虑risk distribution,constraint,以及slippage等
【在 s*******n 的大作中提到】 : : 借问行业中真正的标准是啥 : 如果不用model选择的标准的话? : 如何选择strategy呢?
|
S*********g 发帖数: 5298 | 112 看你是在什么horizon了
fundamental model和techinical model各自有各自的强项
其实fundamental model和quantitative model不排斥
现在有不少fundamental model是全自动quantitative的
基于news的model也可以是全自动quantitative的
【在 s*******n 的大作中提到】 : : 借问行业中真正的标准是啥 : 如果不用model选择的标准的话? : 如何选择strategy呢?
|
S*********g 发帖数: 5298 | 113 0.2 correlation的,R^2也不错了,也有0.04了
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
M*******i 发帖数: 82 | 114 什么universe/horizon能有20% correlation阿
大侠给个paper的link?
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
k*******d 发帖数: 1340 | 115 弱弱地问一下这里R^2的准确定义是什么啊?某个东西的variance?
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
n****n 发帖数: 59 | 116 ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实
和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话,
但是两方面相辅相成,相生相克。 |
s*******s 发帖数: 1568 | 117 personally I don't like any fitting/ml based model, try to use R^2 to
measure how good it is all the time. The most profitable strategies I saw
never use any stats/ml techniques, just purely derived from market intuition.
my two cent.
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
s*******n 发帖数: 631 | 118
能赚钱这个标准当然是
关键这个是事后的标准
在做决策时候的标准是啥?
【在 S*********g 的大作中提到】 : 能赚钱是唯一标准 : R^2最好的setup不一定是最能赚钱的。 : 因为R^2是个理论值, : 它不考虑risk distribution,constraint,以及slippage等
|
S*********g 发帖数: 5298 | 119 rigorous in-sample/out-sample back testing
【在 s*******n 的大作中提到】 : : 能赚钱这个标准当然是 : 关键这个是事后的标准 : 在做决策时候的标准是啥?
|
S*********g 发帖数: 5298 | 120 不矛盾,好多好用的quant model都是有很好的market intuition的
quant model可以帮你把intuition量化,做严格的back testing
intuition.
【在 s*******s 的大作中提到】 : personally I don't like any fitting/ml based model, try to use R^2 to : measure how good it is all the time. The most profitable strategies I saw : never use any stats/ml techniques, just purely derived from market intuition. : my two cent.
|
|
|
J*****n 发帖数: 4859 | 121 我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么? |
s*******n 发帖数: 631 | 122
quant model可以帮你把intuition量化?
确定可以做到么?
【在 S*********g 的大作中提到】 : 不矛盾,好多好用的quant model都是有很好的market intuition的 : quant model可以帮你把intuition量化,做严格的back testing : : intuition.
|
a*****e 发帖数: 1717 | 123 第一条从很多层面上不成立。
【在 n****n 的大作中提到】 : ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实 : 和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话, : 但是两方面相辅相成,相生相克。
|
S*********g 发帖数: 5298 | 124 举个最简单的例
AR model,或者pair trading
【在 s*******n 的大作中提到】 : : quant model可以帮你把intuition量化? : 确定可以做到么?
|
s*******n 发帖数: 631 | 125
这个我了解
关键是quant model不能完全准备表达
intuition
这是我的观点
【在 S*********g 的大作中提到】 : 举个最简单的例 : AR model,或者pair trading
|
S*********g 发帖数: 5298 | 126 不一定要实时算的
好多东西可以先算好,然后就做简单的matching
如果实在计算量大,可以并行计算
么?
【在 J*****n 的大作中提到】 : 我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么?
|
b*********e 发帖数: 38 | 127 这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便
在超高频见过这样的signal,基本上也是unscaleable.
现实总是残酷的
【在 w**********y 的大作中提到】 : Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的 : strategy". : 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是 : correlation...) : HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多
|
s*******s 发帖数: 1568 | 128 why? if you are doing pure arb/latency arb, correlation should close to 1.
Sharpe should be > 30 in production.
【在 b*********e 的大作中提到】 : 这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便 : 在超高频见过这样的signal,基本上也是unscaleable. : 现实总是残酷的
|
s*******s 发帖数: 1568 | 129 The problem was most of those strategies are hard to back tests...they are
trying to impact the market to make money. As far as know SPOT Trading lose
tons of money on trading futures due to a software glitch several years ago,
and they develop a very profitable strategy based on that --- impact the
market.
【在 S*********g 的大作中提到】 : 不矛盾,好多好用的quant model都是有很好的market intuition的 : quant model可以帮你把intuition量化,做严格的back testing : : intuition.
|
S*********g 发帖数: 5298 | 130 quant当然也不是万能的。寸有所长,尺有所短。
你这个strategy不叫predict market
是擦边球的manipuldate market吧
lose
ago,
【在 s*******s 的大作中提到】 : The problem was most of those strategies are hard to back tests...they are : trying to impact the market to make money. As far as know SPOT Trading lose : tons of money on trading futures due to a software glitch several years ago, : and they develop a very profitable strategy based on that --- impact the : market.
|
|
|
w**********y 发帖数: 1691 | 131 Isn't this the tricky part of Ultra HFT? Welcome to share more insiders'
views :)
When people mentioned R^2, that might be assumed to be a rough estimate of
predictability of the signal/predictive model. Frankly, the said 0.04 R^2
was from 2012 several months'out-of-sample test, with a medium trading
frequency. Impossible to be replicated in real life. Or why I need to put
that into a paper...
lose
ago,
【在 s*******s 的大作中提到】 : The problem was most of those strategies are hard to back tests...they are : trying to impact the market to make money. As far as know SPOT Trading lose : tons of money on trading futures due to a software glitch several years ago, : and they develop a very profitable strategy based on that --- impact the : market.
|
S*********g 发帖数: 5298 | 132 给个paper的link吧
【在 w**********y 的大作中提到】 : Isn't this the tricky part of Ultra HFT? Welcome to share more insiders' : views :) : When people mentioned R^2, that might be assumed to be a rough estimate of : predictability of the signal/predictive model. Frankly, the said 0.04 R^2 : was from 2012 several months'out-of-sample test, with a medium trading : frequency. Impossible to be replicated in real life. Or why I need to put : that into a paper... : : lose : ago,
|
d*******t 发帖数: 273 | 133 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
strategy能放production。 |
w**********y 发帖数: 1691 | 134 我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这
些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲
【在 S*********g 的大作中提到】 : quant当然也不是万能的。寸有所长,尺有所短。 : 你这个strategy不叫predict market : 是擦边球的manipuldate market吧 : : lose : ago,
|
w**********y 发帖数: 1691 | 135 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
paper 在优化上的一些步骤应该有问题...
【在 d*******t 的大作中提到】 : 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几 : 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个 : strategy能放production。
|
S*********g 发帖数: 5298 | 136 我是外行,没做过超高频的东西。
超高频的好像也确实不怎么需要我们quant
【在 w**********y 的大作中提到】 : 我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这 : 些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲
|
J*****n 发帖数: 4859 | 137
mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是
regression类型的model,注重预测未来。
我一直很好奇,有没有人把两种方法巧妙地结合起来用的?
还是这两种做法天生就是相克的?
【在 S*********g 的大作中提到】 : 我是外行,没做过超高频的东西。 : 超高频的好像也确实不怎么需要我们quant
|
S*********g 发帖数: 5298 | 138 1. I do not agree those are completely different. They are both predicting
price movement using historical pattern. Rule-based strategy typically works
on price while regression model typical works on return.
2.Trend-following used by typical CTA is just a very small subclass of rule-
based strategies. Most modern CTAs use strategies beyond trend-following.
3. Rule-based strategies can typically find supports in regression/
optimization results. For example, moving average trend-following/mean-
reversion is just an AR model (in price). Pricing formula can also be traced
back to an optimization outcome with some sort of risk assumption.
I heard Two-sigma uses forecast/optimization of different horizons in their
CTA program. But, their CTA program did not out-perform industry leaders
such as Winton.
QIM uses some kind of machine learning technique to choose from a large set
of rules.
【在 J*****n 的大作中提到】 : : mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是 : regression类型的model,注重预测未来。 : 我一直很好奇,有没有人把两种方法巧妙地结合起来用的? : 还是这两种做法天生就是相克的?
|
p****u 发帖数: 2596 | 139 学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。
【在 d*******t 的大作中提到】 : 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几 : 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个 : strategy能放production。
|
p****u 发帖数: 2596 | 140 这种算法的paper真的是编数据结果太容易拉,一般谁都没有办法去verify结果对不对.
【在 w**********y 的大作中提到】 : 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历. : 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇 : paper 在优化上的一些步骤应该有问题...
|
|
|
S*********g 发帖数: 5298 | 141 Isn't that part of the game to mislead your competitor and waste their man
power and time?
【在 p****u 的大作中提到】 : 学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。
|
H*T 发帖数: 43 | 142 不管什么样的model,都要tradeable,比如能beat交易成本。
各位有经验的说说,在做回测时,都用什么样的成本估计?对于
一个大的day order, 1bps above vwap reasonable? |
h****e 发帖数: 2125 | 143 这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊
【在 S*********g 的大作中提到】 : Isn't that part of the game to mislead your competitor and waste their man : power and time?
|
J*****n 发帖数: 4859 | 144
其实我觉得这些人是本末倒置。
应该是先有optimization的框架,然后往里面填策略。
而不是先有策略,然后再去找合适的optimization。
我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不
同之处。
【在 w**********y 的大作中提到】 : 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历. : 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇 : paper 在优化上的一些步骤应该有问题...
|
k***f 发帖数: 10 | 145
做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒
木头都会香。
【在 J*****n 的大作中提到】 : : 其实我觉得这些人是本末倒置。 : 应该是先有optimization的框架,然后往里面填策略。 : 而不是先有策略,然后再去找合适的optimization。 : 我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不 : 同之处。
|
J*****n 发帖数: 4859 | 146
你跟我抬这个杠有意思么?
你见过哪家公司,同类型的策略用不同的optimizer的?
【在 k***f 的大作中提到】 : : 做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒 : 木头都会香。
|
S*********g 发帖数: 5298 | 147 总会有各种泄密渠道的
特别是如果你是industry leader的话
【在 h****e 的大作中提到】 : 这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊
|
J*****n 发帖数: 4859 | 148
这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。
【在 S*********g 的大作中提到】 : 总会有各种泄密渠道的 : 特别是如果你是industry leader的话
|
k***f 发帖数: 10 | 149
世界之大,无奇不有。何况你谈论的情况一点也不稀奇。
【在 J*****n 的大作中提到】 : : 这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。
|
J*****n 发帖数: 4859 | 150
阁下倒是说些稀奇的,让我等也开开眼界。
【在 k***f 的大作中提到】 : : 世界之大,无奇不有。何况你谈论的情况一点也不稀奇。
|
|
|
S*********g 发帖数: 5298 | 151 真是服了你们了,什么都能吵起来
【在 J*****n 的大作中提到】 : : 阁下倒是说些稀奇的,让我等也开开眼界。
|
J*****n 发帖数: 4859 | 152
我说的也都是些稀松平常的东西。
既然这位高人说知道啥稀奇的东西,自然要请教一二。
【在 S*********g 的大作中提到】 : 真是服了你们了,什么都能吵起来
|
h********3 发帖数: 2075 | 153 其实计算机能做的事情也就帮助分析,比如快速计算相关性,关联性等等。至于这些结
果有没有用,还是得人来分析。也就是说,计算机只能在大规模数据计算上帮助人,但
是智能点的推理都是不靠谱的。
实际上除了现实里面大部分能用的就data mining。machine learning那么多炫的技术
可用的极少。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
h********3 发帖数: 2075 | 154 工业界都是简单模型。
【在 s******a 的大作中提到】 : 华尔街用的都是很简单的东西 : : finance
|
k****t 发帖数: 15 | 155
非常同意,很容易在细节上交学费,亏钱是小事,严重起来把桌子或公司搞倒都有可能
【在 b*********e 的大作中提到】 : Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学 : 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就 : 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候 : ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型 : 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。
|
x****m 发帖数: 1084 | 156 R2要是0.6几的话算好还是不好啊?大家都说0.04我搞糊涂了,我在学校的时候
用ANN做预测的,感觉结果好坏和数据的相关性太大了 |
S*******s 发帖数: 13043 | 157 any comments on their work?
【在 L*******t 的大作中提到】 : Vol的可预测度就高多了。比起mean return来。 : 也有人做过Price和VOl的联合建模,发表在JF上了。。
|
D*****a 发帖数: 2847 | 158 ML就是事后诸葛亮
啥都能fit
真要用,基本亏钱
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
S*********g 发帖数: 5298 | 159 is this the strategy described in the paper exploratory trading?
lose
ago,
★ 发自iPhone App: ChineseWeb 7.8
【在 s*******s 的大作中提到】 : The problem was most of those strategies are hard to back tests...they are : trying to impact the market to make money. As far as know SPOT Trading lose : tons of money on trading futures due to a software glitch several years ago, : and they develop a very profitable strategy based on that --- impact the : market.
|
t**********h 发帖数: 2273 | 160 一直以为你是马工。原来是华尔街赚打钱的啊?牛逼。
finance
【在 m**********4 的大作中提到】 : 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读 : 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance : 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是 : 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science : data, 现在基本还在用70年代那几个model. 很多finance papers做linear models, : R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果 : 在实际中用起来风险很大.. : 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的 : 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测, : 那PROFIT MARGIN很快就会消失了吧。。
|
|
|
d*****e 发帖数: 7368 | 161 给一堆数据也没啥, 不就是PCA/SVD分析以下么.
关键是你给的这堆数据要真的有用的.
of
【在 a*******1 的大作中提到】 : 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of : -sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准 : 。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆 : parameter然后用linear regression/svm选significant的出来。。。 : 请拍砖。。。
|
d*****e 发帖数: 7368 | 162 不知道别的公司怎么样, 其实都是拍脑袋, 这几个参数怎么样.
然后, 找历史数据看看支持不支持, 然后就上了, 看挣不挣钱.
【在 s******a 的大作中提到】 : 华尔街用的都是很简单的东西 : : finance
|