d**********o 发帖数: 1321 | 1 第一个项目report
这时偶刚到CSAC工作不久,与小A同学还不熟,我用的还是latex。随着贴的作业越来越
多,应该是用有共同爱好的小伙伴更亲密些。这次贴latex,下次才再org-mode。
\documentclass[b5paper,11pt, abstraction, titlepage]{scrartcl}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{CJKutf8}
\usepackage{multirow}
\usepackage{multicol}
\usepackage{listings}
\usepackage{geometry}
\geometry{b5paper}
\usepackage{graphicx,floatrow}
\usepackage{graphicx,subfigure}
\newsavebox{\abstractbox}
\renewenvironment{abstract}
{\begin{lrbox}{0}\begin{minipage}{\t... 阅读全帖 |
|
d**********o 发帖数: 1321 | 2 第一个项目report
这时偶刚到CSAC工作不久,与小A同学还不熟,我用的还是latex。随着贴的作业越来越
多,应该是用有共同爱好的小伙伴更亲密些。这次贴latex,下次才再org-mode。
\documentclass[b5paper,11pt, abstraction, titlepage]{scrartcl}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{CJKutf8}
\usepackage{multirow}
\usepackage{multicol}
\usepackage{listings}
\usepackage{geometry}
\geometry{b5paper}
\usepackage{graphicx,floatrow}
\usepackage{graphicx,subfigure}
\newsavebox{\abstractbox}
\renewenvironment{abstract}
{\begin{lrbox}{0}\begin{minipage}{\t... 阅读全帖 |
|
c*****h 发帖数: 166 | 3 刚面完第二轮 希望对各位有帮助吧
一面大概1小时 用google doc写java code
1. 最challenging的project 问的很细 关注challeing在哪 怎么解决的
2. abstract class和interface的区别 什么时候用哪个
3. 实现List deduplicate(List phoneNumbers) {}
我先写把list加到一个set里面然后把set包装成list出来 他就笑了说不给这么搞 用别的data
structure 然后我就写了个用HashMap的.然后问复杂度 然后问hashCode怎么写 其实后来想想
用HashMap的话和原来是一样的 都靠的是HashMap的keySet是一个set
4. reservoir sampling. 实现List getRandomSample(Iterator itr,
int sampleSize) {} 返回sampleSize个随机的元素 因为只给了Iterator拿不到
collection的size我就 |
|
o*****m 发帖数: 950 | 4 我运行以下
proc surveyselect data = basic
n=1000 out=samplesize;
strata client_id tier / alloc=prop nosample;
run;
But keep get error, saying
697 proc surveyselect data = basic
698 n=1000 out=samplesize;
699 strata client_id tier / alloc=nosample;
-
22
-----
202
ERROR: Variable NOSAMPLE not found.
ERROR 22-322: Syntax error, expecting one of the following: a name,... 阅读全帖 |
|
c*****a 发帖数: 808 | 5 hi, i am learning SAS too.
%let samplesize=5;
data a;
input x;
cards;
1
2
3
4
5
;
data b (rename=(x=y) keep=x);
if _n_ =1 then do i=&samplesize to 1 by -1;
pt=nobs-i;
set a nobs=nobs point=pt;
output ;
end;
stop;
run;
option missing = 0;
data final;
set a;
set b;
z=x-y;
run;
The outcome is :
Obs x y z
1 1 0 0
2 2 1 1
... 阅读全帖 |
|
发帖数: 1 | 6 版上samplesize不足啊,看put/call ratio会不会更好点 |
|
m*****5 发帖数: 23482 | 7
racked, thevoguecity, samplesally, etc. |
|
|
l***a 发帖数: 5114 | 9 哈哈好麻烦, 这么小的samplesize, 8票对7票很不显著啊。不如本版大出血,两个都
奖励。zzz |
|
m******r 发帖数: 1033 | 10 上来给大家汇报一下工作。
一开始我也以为overfit了,哪里出了错。仔细检查了代码,整个过程没什么错误。 虽
然这是个比较大的项目,很多代码copy来copy去 但是我造这个模型用的是最近12月的
数据, 真正的测试数据是更早的数据:前24个月到前12个月。 也就是我造模型的数据
在我的硬盘里,测试的数据在数据库里躺着呢。
这简直就是物理隔离啊。
今天我把测试的12个月数据每个月单独拎出来测一遍。 这样每个月只有1K~2K人群
samplesize应该算很小了,结果目测还是很好的,反正就那10个数从100%递减到0%, 按
score_rank递减,我连AUC都懒得看,因为趋势是很明显的。
于是我就这样给老板交差了。
还有一个原因是这个xgb做的模型是其中一个部分,大部分还是用回归做的。 如果所有
模型都得到这么高的AUC, 我还真发毛了。 |
|
s****d 发帖数: 14 | 11 http://www.hftradingbook.com/content/index.php?option=com_jumi&
Statistical Arbitrage(cpp文件)
内容如下:
////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////
void AnalyzePair(char* symbol1, char* symbol2)
{
double close1[100] = {0};
int n1 = 0, dates1[100] = {0};
double close2[100] = {0};
int n2 = 0, dates2... 阅读全帖 |
|
s*****r 发帖数: 790 | 12 你这个问题显然不满足正态的假设。你是想估计proportion.
通常情况下 exact 95% CI 不会是对称的(一般大家求的,不是说不能,symmetric if using normal approximation)。你还需要有一个假
设,就是真实的rate是多少。rate越接近0.5 sample size 就需要越大。
I suggest the following sample size calculator. (ps I am not familiar with survey data so the above is just general statistical consideration)
http://www.raosoft.com/samplesize.html
个数除以广告展现数)。这个rate在我总
normal distribution, 95% confidence
formula |
|
c*****a 发帖数: 808 | 13 以前我上课听一个stat computation的老师,经常在吹R的vectorization, how
awesome vector operations in R. 他也是叫我们少用for loop,多用sapply, lapply
什么的.
如果2个for loop在一起用算大点点的samplesize,等半天啊 |
|
e*****s 发帖数: 273 | 14 自己顶一下,找到了个“samplesize”package,但是只能算(unpaired)Wilcoxon-
Mann-Whitney/rank sum。
可是俺要的是paired的signed rank啊,难道真的要自己run一个蒙特卡罗simulation么。 |
|