k*z 发帖数: 4704 | 1 只能查到Quantile啊,哪里有average? |
|
i****e 发帖数: 451 | 2 如果你确定45°对应你的理想情况的话,回归不一定最好,因为回归是不对称的。
你就取(X-Y)的绝对值,或者平方,然后比较每两组的这个分布的不同,简单又好
离的近的和远的也容易分的很,用个QUANTILE就可以了
如果理想情况不一定是45°就回归好了 |
|
d****g 发帖数: 1099 | 3 谢谢lovetillburn的idea.不过t/z-分布啥的,io一看不明白,很容易招致RFE.
上次shhyoung用统计的方法给出一个表,里面有quantile 1, 5,10啥的,当然有mean
value,当然这些数据都是自己处理出来的。
SavageSG's idea简单,或许更实用。
无论如何,谢谢楼上两位。
. |
|
s*******n 发帖数: 261 | 4 我记得去年在一个帖子里,好像叫shyoung啥的,如果拼错了,请原谅啊。
用关于 journal percentile (sth like 2.5%, 10%).
有人知道是怎么计算的么?
我想用这个 journal percentile
又怕IO问我怎么计算出来的
万分感谢 |
|
|
|
j**l 发帖数: 429 | 7 Q是quantile, Q1就是top 25%, Q2 是25-50...
SJR就是 scimago journal rank index, 后面的数字就是SJR的值, 不是2组数, 是一个
数 |
|
a******r 发帖数: 597 | 8 多谢,主要记得有个帖子提到用了什么the top percentile was calculated based on
the quantiles of eigenfactor score.就想简单点给个排名和杂志总数,然后给个百
分数,不十分确定,所以问了这个愚蠢的问题 |
|
s****i 发帖数: 391 | 9 就是那个quantiles of 5 year SCI for 7374 journals,然后说多少是top 1%,多少
是top 5%之类的那个统计数据。请问这个有官方的吗? |
|
s**********s 发帖数: 814 | 10 多谢,夏妹妹。那我就直接写出公式来:The top percentage is based on the
quantiles of 5-year IF for all the 8073 journals calculated using the
following equation: ranking=排名/8073×100%。 |
|
s*********u 发帖数: 2535 | 11 怎么这个东东也搞得这么复杂。请看看置顶的模板,也就是列表下面加了一句话,说是
The top percentile is based on the quantiles of Eigenfactor score for all
the 8336 leading scientific journals indexed by Thomson Reuters Journal
Citation Reports
啥公式都不用,IO哪会看。 |
|
A**i 发帖数: 4328 | 12 我是丑人委员会会长
长得也就末尾30%QUANTILE,也不是丑得惊动党中央啊, 还行,唉~就是超重了,比平
均大概超重个20lb |
|
b*******e 发帖数: 24532 | 13 首先样本不明,虽然说是30 % quantile,但是要是换成北美华人小姐选举...
呵呵 |
|
A**i 发帖数: 4328 | 14 你得讲的通俗点
比如指定一个DISTRIBUTION,不然怎么能弄清楚QUANTILE??? |
|
b****m 发帖数: 318 | 15 其实中国人里面除了王还有巴特尔也比姚早来NBA,您贵人多忘事儿
林现在FT确实让人着急。但是场均得分PG里面排22,助攻PG里面排12,对得起网队的这
个首发位置。ESPN上89个PG。林刚好在1st quantile. 我不知道巨星的标准top多少,
但是林现在的工资肯定不是巨星级别的,所以说他没有巨星相我也认了,经济第一。但
是有人说他mediocre,我无法从数据上看出来。
PER所有球员里面排34,网队里面排第二,确实有点儿大牌既视感。 |
|
s*******t 发帖数: 2896 | 16 可见说话不能太实在。评级多少在其次,关键是看video排顺序。FP我以为在版上有85-
90% quantile了,就因为说话实,被扣了若干帽子、评低(虽然3.5我觉得合适,但是
相对于本版的浮夸风,明显被压了分)。
老三死活不说自己跟楼主比熟高熟低,滑头得很。 |
|
b*w 发帖数: 2062 | 17 问题是很多时候等热起来再进去就已经晚了,能赶上头班车最爽,可惜这东西很难精确
预测,看自己到底想干啥。其实每一行能到top quantile都还不错。 |
|
g**a 发帖数: 2129 | 18 就算多给,也是在每平米房价上往上提一点。不可能根据以后的规划来分级补偿。而且
补偿的房价不可能远高于当时当地的商品房价格。甚至都不会高于当时当地商品房价格
的25% quantile。要不然你让政府喝西北风去?
50平米换240平米,在假设两地房价相等的情况下,n>=5。政府会干?除非两地房价在
当时相差至少3倍以上,再加上一些政策性的补贴和非凡的闹事能力才有可能。
他后面那个例子是同样的道理。北京有四合院的地方是什么地方?你们好好想想吧! |
|
b*****a 发帖数: 1732 | 19 我也是鼠哥这个看法。
如果不想麻烦去搞其他model,
就可以多try几个cut,比如median cut, quantile cut,或者1/3 cut等等
哪个hypothesis test 出来好就用哪个。然后把结果都拿给经理看。我觉得还多复合逻
辑的呢。
at |
|
x******a 发帖数: 6336 | 20 谢谢,例如,我要simulate一个portfolio的var,
这个portfolio有1000-6000positions,
对每个position,要simulate一个random number,计算it的pal
然后所有pnl的和作为这个portfolio的pnl,
我simulate 100000次,记下来每次的pnl,会得到一个pnl的分布,然后取1%的
quantile。
我用time(0)做seed, 发现下面两种写法,Myrandom randn的位置不同导致结果有20%
以上的差异。
1.
vector PnL;
Myrandom randn;
for(i=0; i
double sum=0;
.......
for(j=0; j
.....
getpnl();
sum+=getpnl;
}
PnL.pushback(sum);
}
sort(PnL.be... 阅读全帖 |
|
g******w 发帖数: 78 | 21 Quantile Normalization可以试试 |
|
w***g 发帖数: 5958 | 22 这个mas5的数值直接用可以吗?
或者mas5经过quantile normalization就可以直接用了吗?
主要是我这个数据提取不能显得太外行。后续机器学习倒是没问题。
多谢! |
|
g******w 发帖数: 78 | 23 Quantile Normalization可以试试 |
|
w***g 发帖数: 5958 | 24 这个mas5的数值直接用可以吗?
或者mas5经过quantile normalization就可以直接用了吗?
主要是我这个数据提取不能显得太外行。后续机器学习倒是没问题。
多谢! |
|
f**r 发帖数: 70 | 25 It's indeed hard to argue. Irizarry wrote a paper to compare the 3 algorithms
in 2003 on Nucleic Acids Res. We've done some simulation studies and found
that his conclusions are pretty objective. While RMA is better with the
lower-expressed genes, it underestimates fold changes in a great deal, which
often times is very annoying to explain to the clinicians. But it's
interesting that in Affymetrix's to-be-released new algorithm (not called
MAS6, but some new name), they inherit the quantile |
|
j*p 发帖数: 411 | 26 本人在wet lab里面做纯数据分析,for NGS data analysis, 简单介绍一些自己接触过
,并且觉得挺有用的工具,说的有点杂,权作抛砖引玉,还请不吝赐教。
Next-Gen sequencing(NGS)和现在正在发展的3rd-gen sequencing将会在生物学研究中
被越来越广泛应用。不管你信不信,反正我信了。一是基于实验成本的降低($1k
whole-genome sequencing is coming),越来越多的实验室可以操作;二是可以提供
相对low throughput experiment多的多的数据和信息,可以看到很多从前看不到的东
西;三是sequencer本身对测序的准确性正在逐渐提高,所以实验固有错误率降低;四
是各种算法的成熟应用,这使得很多由于实验产生的误差在出数据后通过对数据的分析
得以过滤。按照library preparation来分,NGS主要有DNA-seq和RNA-seq
DNA-seq is usually used as ChIP-seq to study transcription factor(TF)-DNA
bi... 阅读全帖 |
|
j*p 发帖数: 411 | 27 本人在wet lab里面做纯数据分析,for NGS data analysis, 简单介绍一些自己接触过
,并且觉得挺有用的工具,说的有点杂,权作抛砖引玉,还请不吝赐教。
Next-Gen sequencing(NGS)和现在正在发展的3rd-gen sequencing将会在生物学研究中
被越来越广泛应用。不管你信不信,反正我信了。一是基于实验成本的降低($1k
whole-genome sequencing is coming),越来越多的实验室可以操作;二是可以提供
相对low throughput experiment多的多的数据和信息,可以看到很多从前看不到的东
西;三是sequencer本身对测序的准确性正在逐渐提高,所以实验固有错误率降低;四
是各种算法的成熟应用,这使得很多由于实验产生的误差在出数据后通过对数据的分析
得以过滤。按照library preparation来分,NGS主要有DNA-seq和RNA-seq
DNA-seq is usually used as ChIP-seq to study transcription factor(TF)-DNA
bi... 阅读全帖 |
|
l**********1 发帖数: 5204 | 28 Continue:
第四乐章 Finale
找有关的PhD dissertation 里边的 R source code program
while U can debug it or even rewrite it for another task,
then you already masted NGS coding skills.
比如
http://www.dspace.cam.ac.uk/handle/1810/218542
DSpace at Cambridge
title: Genome-wide analyses using bead-based microarrays
Authors: Dunning, Mark J
Issue Date: 4-Sep-2008
Files in This Item:
File Description Size Format
dunning_thesis_.pdf 10.47 MB Adobe PDF
its Appendix B
R source Code f... 阅读全帖 |
|
l**********1 发帖数: 5204 | 29 so what? if your found can solve solid wet or hard bio can’t solve non-
linear trend between
count level and variance by Deseq or other softs ?
pls refer,
01-16-2013, 12:40 AM #1
JesperGrud
Junior Member
Location: Odense
Join Date: Aug 2012
Posts: 5
DESeq and independent filtering
Hi everyone
I know this topic has been up a few times, but yet there is a question. So
the basic idea about filtering is that it is done unsupervised to remove
genes that are too lowly expressed to become signif... 阅读全帖 |
|
i*****i 发帖数: 154 | 30 正在学着用bioconductor里面的beadarray+limma分析数据。
初步就是看看differential expressed gene。
我用的步骤是
1.用readBeadSummaryData读入summary level的数据,因为core已经提供了quantile
normalized, background subtracted的数据了,我就直接用了。
2.用genefilter去掉所有表达值小于4的probe (f1 <- pOverA(1, 4))
3.用limma分析差异表达基因
4.用toptable输出结果
不知道以上步骤有没有问题。
另外我有一些问题想请教:
1. toptable给的结果是按照logFC排列的,数值有正有负,如何把up regulation和
dwon regulation的分开
2. toptable给的结果只有probe ID,怎么样才能把symbol等annotation信息加在这些
选出来的基因的后边,join table as right part。
如果能给出R代码就能帮我少走很多弯路,谢谢。
如果哪位能够提供她/他常用... 阅读全帖 |
|
n******7 发帖数: 12463 | 31 你这个图明显平均、中位数值都不一样...
但是你这个图是对的,解读是,upper x% quantile的值是一样的 |
|
u*******d 发帖数: 3 | 32 【 以下文字转载自 Mathematics 讨论区 】
【 原文由 Uncrowned 所发表 】
在数学和统计学中,outlier、moment对应的中文分别是什么?
怎么定义?谢谢
下面这段话大虾给翻译一下,看得头都大了:
Quantiles characterize distributions of real world data sets
and are less sensitive to outliers than the moments(mean and
variance).
多谢!! |
|
x***u 发帖数: 336 | 33 moment应该是统计量。
outlier是值得那种离大部分数据很远的小部分数据。
quantiles比起moment来说对outlier的敏感度小。 |
|
m******y 发帖数: 266 | 34 在计量经济学里是一个怎样的领域?很火吗?我见到很多人都很关注,想知道为什么。
有没有大牛从big picture来普及普及。。 |
|
|
|
q****i 发帖数: 237 | 37 目前还不是主流吧,主流还在parametric里面弄呢
只是parametric的东西做多做烂了,大家就想开辟nonparametric的领域了
换一种统计方法,也许所有的大小topics又都可以重新整一篇,又得出一堆结果可以讨
论.......... |
|
q****i 发帖数: 237 | 38 是的 :) semipara
function的 |
|
|
m******y 发帖数: 266 | 40 哈哈,一般碰不上,碰上的都是命中注定的,是躲不掉的。 |
|
p********d 发帖数: 1007 | 41 还很新。但是也很难。新的领域往往受很多关注,因为相对容易出paper。 |
|
m******y 发帖数: 266 | 42 我也这么觉得,但是不知道在哪些领域有应用。也不知道目前发展的如何了。
其实最想知道,近两三年,这领域有那些需要注意的文章,新的东西出来太快了啊。 |
|
l********s 发帖数: 430 | 43 你说koenker不会推regression么?我看了他的书觉得他研究挺广了 |
|
|
D*******a 发帖数: 3688 | 45 histogram
kernel functions
quantile estimation
....
或者用parametric的方法 |
|
h***i 发帖数: 3844 | 46 节点一般可以按照quantile选取
次数cubic就差不多了 |
|
m******t 发帖数: 273 | 47 【 以下文字转载自 Quant 讨论区 】
发信人: myregmit (myregmit), 信区: Quant
标 题: how to do data fitting to find distribution
发信站: BBS 未名空间站 (Sat Mar 15 11:02:05 2014, 美东)
Hi,
I need to do data fitting to find the distribution of a given data.
I need to find the pdf funtion of the distribution.
I can use data fitting functions in matlab and python.
It looks like a truncated gamma.
But, how to find the paramters of the distribution ?
What if the data cannot fit the truncated gamma well ?
The QQ-plot (qunatile-qua... 阅读全帖 |
|
o****x 发帖数: 287 | 48 If the trials conducted in China serve mainly for the SFDA approval purpose,
then the market should be small. I think SFDA only requires 300 case
studies for a foreign approved drug to enter Chinese market. 300 patients
should be easily enrolled within a medium sized city. Why are there so many
certified trial centers in China? On top of that, many foreign companies
are setting up trial centers in china, or in collaborating with Chinese
hospitals, for example, Quantiles, Covance, etc. |
|
B*********h 发帖数: 800 | 49 ☆─────────────────────────────────────☆
jjwwjj (jjwwjj) 于 (Sun Apr 8 19:15:20 2007) 提到:
☆─────────────────────────────────────☆
jjwwjj (jjwwjj) 于 (Sun Apr 8 19:16:01 2007) 提到:
我是说的:
在capm中是
r_i - r_f = beta*(r_m - r_f)
其中r_m是expected return of the market, 怎样估算这个r_m?
知道了这个r_m就能得出r_i,
但是r_i和mu又是什么关系呢?
☆─────────────────────────────────────☆
QuantHR (quantile) 于 (Mon Apr 9 00:02:33 2007) 提到:
知道了这个r_m就能得出r_i? Beta呢?
先有鸡还是先有蛋?
r_i和mu都是无风险收益,应为一个。
☆────────────────────────────────── |
|
B*********h 发帖数: 800 | 50 ☆─────────────────────────────────────☆
sw2022 (爬在墙头等红杏) 于 (Sat May 5 18:12:00 2007) 提到:
rt,知道的说下行情。。。
☆─────────────────────────────────────☆
QuantHR (quantile) 于 (Sun May 6 04:43:20 2007) 提到:
有是有的,关键是看你要求了,目前大致分为2类,要不就是刚毕业的,这样待遇在10K
每月左右;要不就是背景很深厚,在国外有相关丰富工作经验,回来直接做Quant管理
或资深Quant。具体国内工作机会可参考http://www.QuantHR.com
☆─────────────────────────────────────☆
xvgsfx (pains) 于 (Sun May 6 16:23:58 2007) 提到:
for a freshman in QUANT, 10K per month is quite expensive in china. so i dou |
|