C***l 发帖数: 2625 | 1 现在有这么一个问题,我们在不同时间点测量若干个研究对象的数据点,即每个时间点
有若干数据,现在要画其中几个时间点上的boxplot,比如,40分钟的数据画一个,80
分钟的话一个,120分钟的画一个,240分钟画一个。可是,用plot或者boxplot功能画
的话,R就自动按照factor的次序排序了,也就是说四个并排的boxplot,第一个是120
分钟的,第二个240分钟,第三个是40,第四个是80分钟,没有按时间先后排。另外,
缺省设置里面只标出了Q1, Q3和median,不能显示mean。请问如何让这些boxplot按照
时间排列,并显示mean?如果能把mean的数值标出就更好。
SAS倒是能满足这些功能,可是SAS画出来的图太难看,老板坚决要用别的办法。图明天
就要搞出来,大伙请给点意见。 |
|
C***l 发帖数: 2625 | 2 现在有这么一个问题,我们在不同时间点测量若干个研究对象的数据点,即每个时间点
有若干数据,现在要画其中几个时间点上的boxplot,比如,40分钟的数据画一个,80
分钟的话一个,120分钟的画一个,240分钟画一个。可是,用plot或者boxplot功能画
的话,R就自动按照factor的次序排序了,也就是说四个并排的boxplot,第一个是120
分钟的,第二个240分钟,第三个是40,第四个是80分钟,没有按时间先后排。另外,
缺省设置里面只标出了Q1, Q3和median,不能显示mean。请问如何让这些boxplot按照
时间排列,并显示mean?如果能把mean的数值标出就更好。
SAS倒是能满足这些功能,可是SAS画出来的图太难看,老板坚决要用别的办法。图明天
就要搞出来,大伙请给点意见。 |
|
l*****k 发帖数: 587 | 3 俺是这样的:
xyplot(x~y, jitter.x=T, col=c("red", "green"), xlim=c("1", "2"))
boxplot(x~y, add=T)
问题是两个图是在一起, 但是轴,x, y, 不完全吻合, 只能说勉强可用。
试过把boxplot 放在panel里, 同样不行, 还比不上用 add=T
google did not give me a good solution either, there seems to have a
gplots package, but that seems to work only on linux
谢谢 |
|
s****y 发帖数: 21 | 4 有三个因变量分别对x做了boxplot的图:
y1~x
y2~x
y3~x
code如下:
proc boxplot data=band;
plot (y1 y2 y3)*x ;
run;
我现在想把y1,y2,y3的图并列起来,这样每一个x的值上有3个box,应该怎样写code呢? |
|
s*r 发帖数: 2757 | 5 时间一定要是factor吗才能画四个并排的boxplot?
如果是的话,一个笨办法是把时间变成char/string,用040替代40,用080替代80
然后再转化为factor用于作图
是micrarray data吗, 我记得rma有内置的画boxplot的方法 |
|
S*****U 发帖数: 99 | 6 谢谢你回复, 能具体一点吗, 我其实只有y值,x-axis是两个category,
但是points要求points(x, y)? 下面的code能做boxplot, 但不是点的形式
disease=rpois(10000, lambda=5)
control=rpois(10000, lambda=2)
boxplot(disease, control) |
|
g********r 发帖数: 8017 | 7 自己些个小循环,生成一个list,顺序随你怎么排。boxplot那个list。
画mean就不知到了。
80
120 |
|
b******a 发帖数: 1470 | 8
80
120
##产生数据####
a<-rnorm(10)
b<-rnorm(10)
c<-rnorm(10)
d<-rnorm(10)
##画图, 坐标轴忽略##
boxplot(a,b,c,d,axes=FALSE)
#放置你需要的横轴坐标#
axis(1,1:4,c(120,220,320,420))
#默认纵轴#
axis(2)
#####
box()
#画均值, 画线很麻烦#
points(1,mean(a),col=2)
points(2,mean(b),col=2)
points(3,mean(c),col=2)
points(4,mean(d),col=2)
希望能抛砖引玉 |
|
h******e 发帖数: 1791 | 9 要做linear regression model,从histogram和boxplot里能看出什么有用的信息呀?
谢谢。 |
|
C***l 发帖数: 2625 | 10 我记得R里面可以分步作图,但不记得具体怎么做了,如果谁能提醒一下,应该可以在
同一个图上,先画第一个,然后画第二个,这么下去按顺序就能画出来,可是如何分别
画boxplot,并按自己要求标记坐标呢?也就是说,怎样令坐标显示出来是按40min,
80min,120min, 240min的次序? |
|
x*o 发帖数: 85 | 11 I am using SGplot to produce boxplot.
It seems the default is to show all the data from min value to max value,
but now, we want to only display 5% to 95% instead of max and min. Anyone
know how to do this?
Thanks!!!!!!! |
|
l**********1 发帖数: 5204 | 12 Continue:
第四乐章 Finale
找有关的PhD dissertation 里边的 R source code program
while U can debug it or even rewrite it for another task,
then you already masted NGS coding skills.
比如
http://www.dspace.cam.ac.uk/handle/1810/218542
DSpace at Cambridge
title: Genome-wide analyses using bead-based microarrays
Authors: Dunning, Mark J
Issue Date: 4-Sep-2008
Files in This Item:
File Description Size Format
dunning_thesis_.pdf 10.47 MB Adobe PDF
its Appendix B
R source Code f... 阅读全帖 |
|
S******y 发帖数: 1123 | 13 I have written a function (see below) which encloses a boxplot. My
function "xbox" takes in a variable name (such as "age"), and do a boxplot.
Now I would like to add a title for the graph dynamically displaying the
variable name as part of title.
But, in reality, the title displays VALUES of my variable.
Obviously, sprintf does not work.
Can somebody shed light on how to solve my problem in properly displaying a
title ?
Thanks. |
|
w******4 发帖数: 5 | 14 I want to find out or locate the outliers. When I'm using the boxplots, the
interessting thing is that it told me number1 is the only outlier. When I
deleted number1 and boxplot again, and found out there is another outlier.
So is there anyone can give me another way to find out outliers? Thanks a
lot. |
|
p***l 发帖数: 1775 | 15 proc univariate 里可以用
var A
by B C
来画BC 2个factor 所有level组合的 box plot
但是出来的图实在太粗糙
想问问有谁知道在gplot里或者boxplot procedure里怎么实现这个功能
看到的gplot或者boxplot里一般只有plot A*B,不知道怎么把factor C加进去 |
|
n******7 发帖数: 12463 | 16 经常看到比较两组数据差异的图用barplot,mean加上SE
然后给个t-test的pv
我的理解是,这种barplot图应该是默认了样本是正态分布的
这个前提不能满足的时候,应该用boxplot,做wilcox test
这个理解应该没错吧?
有个人很固执的用barplot做结果,变化的fold也就1.2-1.5,但是pvalue很好看
而且y轴经常不是0起始的,这样差异也可以看着很大
至少有些他的分析里面,我肯定y值不是正态分布的。我建议他画画boxplot看看,说了
几次也没用。我总觉得这个有问题,不知道是不是我想多了?我感觉论文里面这样的情
况也挺多的,似乎大家也没人计较。 |
|
E**********e 发帖数: 1736 | 17 就是R里面的boxplots()啊。 对每个predicator做个boxplot, 然后删掉outliers,
可以用1.5~3 std, 取决于你的samples size。 你需要写个小程序来删掉这些
outliers。 另一方法是regression啦,如果outlier是也就一两个的话,看看统计书。 |
|
|
B**d 发帖数: 601 | 19 不过average这一项我感觉还是不够
sample size啊
standard deviation啊
最好有个boxplot什么的
因为也许有的学校贫富差距大呢 |
|
e****e 发帖数: 3450 | 20 我按这个readme来的
Software Requirements
=====================
1. GCC is required to compile most tools.
2. FASTA-Clipping-Histogram tool requires Perl, the "PerlIO::gzip",
"GD::Graph::bars" modules.
Installing the perl modules can be accomplised by running:
$ sudo cpan 'PerlIO::gzip'
$ sudo cpan 'GD::Graph::bars'
3. FASTX-Barcode-Splitter requires the GNU Sed program.
4. FASTQ-Quality-Boxplot and FASTQ-Nucleotides-Distribution requires the
'gnuplot' program.
Installation
===== |
|
|
|
|
l***a 发帖数: 12410 | 24 not familiar with R, but can you change data format to get what you want? e.
g. change 40 to 1)40, 80 to 2)80, etc...
80
120 |
|
C***l 发帖数: 2625 | 25 这个,老板不让。x轴的标记必须是40min 80min 120min 240min etc.
e. |
|
l***a 发帖数: 12410 | 26 how does R handle leading blanks? |
|
s**********s 发帖数: 7387 | 27 factor里面也可以调整order吧。
80
120 |
|
|
C***l 发帖数: 2625 | 29 不太清楚,但是要调顺序的不是一个两个,所以一个空格不能解决全部问题 |
|
|
s**********s 发帖数: 7387 | 31 depending on your rawdata format
if you can do it like
data time
1.5 10min
1.3 10min
4.2 20min
1.2 40min
...
..
things will be much easier
i'd say pre-parse your data with perl and then feed it into R. |
|
s**********s 发帖数: 7387 | 32 guess i really don't need more papers and the headache associated with them.
... |
|
g********r 发帖数: 8017 | 33 哦,画mean可以写个循环,用lines()在指定位置画线段画出来。 |
|
g********r 发帖数: 8017 | 34 话说这么多生统的兄弟,有没有人计划JSM组团外拍呀? |
|
C***l 发帖数: 2625 | 35 though i don't quite understand this process, I got it figured out through
another person's hint on levels().
Thanks anyway~ |
|
C***l 发帖数: 2625 | 36 用levels()解决了,list具体怎么做? |
|
C***l 发帖数: 2625 | 37 I used points() to make means as a dot at the center of the box. thanks! |
|
g********r 发帖数: 8017 | 38 就是写个for loop,赋予每个list的item原始数据里面相应于某个时间点的那些值。用
list的好处是可以插入空item任意调整各个box之间的距离。还可以留出空间来插入文
字。不过比levels麻烦多了。 |
|
|
n*****3 发帖数: 1584 | 40 do something like boxplot instead of simple plot?
一下都要等很久机器才能缓过来,而且
内存然后再读新数据这样才能好一些? |
|
e*******o 发帖数: 4654 | 41 要是你要的图的类型他们没有,就麻烦了,boxplot,我搞了一个星期还没做好。 |
|
N******K 发帖数: 10202 | 42 boxplot一个星期没搞定 你老板没把你咔嚓了? |
|
e*******o 发帖数: 4654 | 43 靠,我最近天天就做这个的。
搞个boxplot 搞了一个星期多,还被本版大牛嘲笑。 |
|
b*******d 发帖数: 353 | 44 我猜你这里的df是指dataframe?
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Da
里面的kind有
kind : str
‘line’ : line plot (default)
‘bar’ : vertical bar plot
‘barh’ : horizontal bar plot
‘hist’ : histogram
‘box’ : boxplot
‘kde’ : Kernel Density Estimation plot
‘density’ : same as ‘kde’
‘area’ : area plot
‘pie’ : pie plot
‘scatter’ : scatter plot
‘hexbin’ : hexbin plot |
|
m****o 发帖数: 182 | 45 我建议对目标值做一个boxplot,计算一下均值和中值。如果均值和中值都在比如说0.
01以下或者很大,你的regression model(R1)实际上效果就很差了。
0. |
|
p*****m 发帖数: 7030 | 46 举个例子 excel没办法画boxplot(有办法写个macro画,但是画出来还是不太
professional),它家不能简单的画出来的图还挺多的 |
|
l********k 发帖数: 14844 | 47 如果被统计的数值可正可负,mean和std不需要有什么大小关系。如果被统计的数据都
是非负的,std仍然可能大于mean,这个取决于具体的分布。比如指数分布,mean =
std,[0 0 1 1],也是mean = std。而比如说[0 0 1], mean = 0.333, std = 0.47,
std > mean.
简言之,分布的不对称性越大,std越是一个不好的参数。如果要画图,通常不能画
mean +/- std bar graph,而是要画成boxplot: |
|
c***3 发帖数: 251 | 48 我觉得他问Standard deviation的意思,主要就是看你这些replicates之间是不是有很
大差异。
你是可以求SD,问题你一共有几个replicates啊?如果你有几十个,画一个boxplot好
了 |
|
l*****a 发帖数: 1431 | 49
对,reviewer就是这个意思,我就3个replicates。除了boxplot,还能怎么做。我的问
题是如果做sd make sense,那为什么这种percetage的data 不用t-test,而用x
square test? 统计学的不好,让大家见笑了。 |
|
t******g 发帖数: 372 | 50 boxplot + 某种均值差异的test
样本太少,貌似是每组4个,所以看不出box了,
同时数值overlay到box上,jitter了一下 |
|