A**H 发帖数: 4797 | 1 我要normalize NGS read count with GC-content
这里有一篇文章
http://journals.plos.org/plosone/article?id=10.1371/journal.pon
中间有些不懂。看了些网站教材,还不是很懂,到这里问一下。只有包子答谢了。
GC-content correction
第一句
To correct for sequencing biases that arise due to preferential sequencing
of certain levels of GC content, we normalize the read depth based on the GC
content of each bin.
第二句
These values incorporate mapability information, such that we only consider
the GC content of mappable bases.
第三句
To correct the data, we first c... 阅读全帖 |
|
c****t 发帖数: 156 | 2 没学过统计,国内一个朋友问我Origin能不能做LOESS回归的图,
给了我这个网站,
http://www.itl.nist.gov/div898/handbook/pmd/section1/pmd144.htm
他的数据如像下图所示,在每个横轴点(时间点)都有一堆数据,
好像目的就是在每个时间点附近找到一个fit的局部回归值,
我问他可以是平均值吗?他说他也不知道。
linear least squares regression 值应该等于平均值吧。
nonlinear regression又是什么?
各位统计专业的,如果能给解释一下LOESS局部回归值的意思和计算方法,
或者知道在origin 里面怎样求这个值,请不吝赐教。
多谢。 |
|
c****t 发帖数: 156 | 3 没学过统计,国内一个朋友问我Origin能不能做LOESS回归的图,
给了我这个网站,
http://www.itl.nist.gov/div898/handbook/pmd/section1/pmd144.htm
他的数据如像下图所示,在每个横轴点(时间点)都有一堆数据,
好像目的就是在每个时间点附近找到一个fit的局部回归值,
我问他可以是平均值吗?他说他也不知道。
linear least squares regression 值应该等于平均值吧。
nonlinear regression又是什么?
各位统计专业的,如果能给解释一下LOESS局部回归值的意思和计算方法,
或者知道在origin 里面怎样求这个值,请不吝赐教。
多谢。 |
|
d*o 发帖数: 108 | 4 How to supress output from this procedure? I got a very lengthy .lst file
because there are so much printout from proc loess.. the typical sas option
'noprint' doesn't work for this proc. thanks. |
|
发帖数: 1 | 5 Yangtze River
RIVER, CHINA
WRITTEN BY: Aleksandr Pavlovich Muranov Charles E. Greer
See Article History
Alternative Titles: Ch’ang Chiang, Chang Jiang, Da Jiang
Yangtze River, Chinese (Pinyin) Chang Jiang or (Wade-Giles romanization) Ch
’ang Chiang, longest river in both China and Asia and third longest river
in the world, with a length of 3,915 miles (6,300 kilometres). Its basin,
extending for some 2,000 miles (3,200 km) from west to east and for more
than 600 miles (1,000 km) from north to so... 阅读全帖 |
|
发帖数: 1 | 6 Yangtze River
RIVER, CHINA
WRITTEN BY: Aleksandr Pavlovich Muranov Charles E. Greer
See Article History
Alternative Titles: Ch’ang Chiang, Chang Jiang, Da Jiang
Yangtze River, Chinese (Pinyin) Chang Jiang or (Wade-Giles romanization) Ch
’ang Chiang, longest river in both China and Asia and third longest river
in the world, with a length of 3,915 miles (6,300 kilometres). Its basin,
extending for some 2,000 miles (3,200 km) from west to east and for more
than 600 miles (1,000 km) from north to so... 阅读全帖 |
|
f***a 发帖数: 329 | 7 ### adjust parameter to meet your needs, hehe :)
#data
y <- c(100,150,160,200,300,290,350,400,450,399,500,1500)
x <- 1:12
nx <- seq(1,12,by=0.1)
plot(x,y,type="b")
#poly
tt <- lm(y~poly(x,10))
lines(nx,predict(tt,newdata=data.frame(x=nx)),col=2)
#loess
lsm<-loess.smooth(x,y,span=1/2)
lines(lsm,col=2)
lsm1<-loess(y~x,span=1/4)
pred<-predict(lsm1,newdata=nx,se=TRUE)
lines(nx,pred$fit,col=4)
lines(nx,pred$fit-1.96*pred$se.fit,lty=2)
#supsmu
lsmsup<-supsmu(x,y)
lines(lsmsup,col=2)
plot(x, y)
for(i i |
|
c**i 发帖数: 6973 | 8 (1) Charles C. Mann, Our Good Earth; The future rests on the soil beneath
our feet. National Geographic, August, 2008.
http://ngm.nationalgeographic.com/2008/09/soil/mann-text
It is a very long article.
My comment:
(a) Photographs 2, 5 and 7 are about China. No. 2 is Loess Plateau, and the
other two are set in Yunnan province. This is the first time I see Loess
Plateau. I had imagined it to be flat. Seeing the photo, I wondered how high
the rice paddy was, how farmer got the water up, and guess |
|
c**********h 发帖数: 6 | 9 分享一个:
美中30个最佳自驾赏秋景好去处
http://www.epochtimeschicago.com/index.php/component/k2/item/21
个人很想去这个:12.伊利诺伊州格利纳镇(Illinois: Galena) ,主要是比较近呵呵。
1.密歇根州奇威瑙半岛(Michigan: Keweenaw Peninsula)
密歇根上半岛风景最为秀丽的奇威瑙半岛,临近五大湖区的最大湖-苏必利尔湖(Lake
Superior),森林茂密,每年九月下旬林木就会变成火红一片。最受欢迎的两条驾车路
线是沿着苏必利尔湖的M-26号公路,以及M-41号公路从北端的Copper Harbor到Lac La
Belle Road一段,可以驾车一路欣赏秋色。此外还可以参观Haven瀑布公园(Haven
Falls Park )或了解当地铜矿业的悠久历史。
2.印第安纳州布朗郡(Indiana: Brown County)
连绵的山脉,美丽的自然风景,曾经吸引了不少艺术家来到印第安纳的布朗郡。今天这
里仍然保留着浓厚的艺术气息,尤其在印州南部的纳什维尔镇(Nashiville)... 阅读全帖 |
|
r******a 发帖数: 136 | 10 http://news.lzu.edu.cn/c/201312/28799.html
美国地球物理学会秋季年会于2013年12月在美国西部城市旧金山(San Francisco)举行
。此次盛会共吸引来自全球24000多名地球和太空研究领域的专家、学者及学生前往参
会。
我校西部环境与气候变化研究院组织了6人的师生团队赴美参会。其中,陈发虎教
授在“Environmental Change in High-Altitude Lakes”分会场作了题为“A 2000-
year dust storm record from Lake Sugan, a small alpine lake in north Tibet
Plateau”的口头报告;聂军胜教授在“Evolution of the Northern Tibetan Plateau
会场作了题为“Provenance of the upper Miocene-Pliocene red clay deposits of
the Chinese Loess Plateau”的口头报告;张东菊博士在“Aeolian Dust in Ea... 阅读全帖 |
|
h*********o 发帖数: 151 | 11 是stats下面的loess吗?
我查了一下manual,说是Fit a polynomial surface determined by one or more
numerical predictors。这样看起来好像是用来做多为的非参估计的。
但是我还是想确认一下,loess(y~x+z)做的是模型:y = f(x,z)+e 吗? |
|
T*******I 发帖数: 5138 | 12 我看过几篇JASA的文章,主要是LOESS方法论的创建人Cleveland的三篇文章。在SAS中
有proc loess的模块。可见这是一个影响比较大的方法论。
但是,我对他的这个方法论中所体现出来的分析逻辑很不欣赏。
spline |
|
e**y 发帖数: 51 | 13 我读过loess, loess还是很不错的idea的。不欣赏是创新的动力。但是正如写文章的开
头一样,别人的价值也是要首先appreciate的。然后再提自己的不欣赏。 |
|
P****D 发帖数: 11146 | 14 Long time ago I used a SAS macro found on the Internet to draw smoothed
curves. I remember it employes LOESS and allows the user to define "smooth
parameter". Just Google loess smooth curve SAS macro... |
|
p******s 发帖数: 137 | 15 三篇在此。。。
1. Title: A COMPARATIVE-STUDY ON OPTICAL EFFECTS OF E-CENTER IN QUARTZ
GRAINS FROM LOESS AND FAULT
Author(s): JIN SZ, DENG Z, HUANG PH
Source: APPLIED RADIATION AND ISOTOPES Volume: 44 Issue: 1-2 Pages:
175-178 Published: JAN-FEB 1993
Times Cited: 2
2. Title: THE IMPROVED SCHEMATIC BAND MODEL FOR ESR AND TL DATING
Author(s): DENG Z, HUANG PH, JIN SH
Source: APPLIED RADIATION AND ISOTOPES Volume: 44 Issue: 1-2 Pages:
287-291 Published: JAN-FEB 1993
Times Cited: 0
3. |
|
w********9 发帖数: 8613 | 16 这是Shorter Oxford American English Dictionary第五版列出的与德语或者日耳曼语
相关的英语词根或词汇。
-at, suffix2. + -dom, suffix. + -ed, suffix1. + -ed, suffix2. + -en, suffix1
+ -en, suffix2 + -en, suffix5 + -en, suffix6 + -er, suffix1. + -er, suffix3
. + -er, suffix5. + -est, suffix1. + -est, suffix2. + -et, suffix2. + -eth,
suffix1. + -hood, suffix. + -ing, suffix1. + -ing, suffix3. + -ish, suffix1.
+ -kin, suffix. + -le, suffix1 + -le, suffix3 + -less, suffix. + -ling,
suffix1. + -ling, suffix2 + -ly, suffix1. + -ly, s... 阅读全帖 |
|
b******3 发帖数: 4385 | 17 Research on science and technology has a long record in human history. New
breakthroughs have been made continuously, with the development and progress
of society, on the way toward the heights of science. Over the past 100
years from thelate 19th century to the present, science and technology have
successively
evolvedthrough the ages of electrification, atomic energy, aviation, and
space, and now enter the information age. They are the most important
impetus to the
development of human civiliza... 阅读全帖 |
|
发帖数: 1 | 18 你这种liar居然还有脸上来,这买买提上舔共的都是些什么玩意?
五毛逗比看好了,这是白修德 Theodore Harold White 著作
"Thunder Out Of China"的原文
其中第十一章讲述河南的灾荒, 159页, 多次明确说河南有3000万人
因为饥饿和疾病死亡约2-3百万。
你这蠢逼给大家解释一下你那“河南1000万人饿死30-50%“是怎么来的?
11. The Honan Famine
“We made our estimates by rough rule of thumb on the basis of
our interviews and the figures we thought most reliable. Of the
30,000,000 people of Honan, probably two or three million had
fled the province, and another two or three million had died of
hunger and disease."
"Honan is a ferti... 阅读全帖 |
|
a**n 发帖数: 2994 | 19 这班上几只舔共的五毛真是人不要脸天下无敌
白修德的Thunder Out of China全文
网上到处都是,上面清清楚楚写了河南3000万人,
https://archive.org/stream/thunderoutofchin031761mbp/
thunderoutofchin031761mbp_djvu.txt
"Honan is a fertile province. Before the war, it supported some
30,000,000 people, who farmed the rich loess soil exhaustively
and pressed upon it to the Malthusian limit. " |
|
发帖数: 1 | 20 没错,没空查是无毛逼说谎的正当理由
实在太他妈正当了
白修得的书的链接(含各种format的全文下载)
发信人: aben (小奔), 信区: Military
标 题: Re: 70年建成完整工业体系值得吹牛吗?
发信站: BBS 未名空间站 (Fri Jul 27 19:33:42 2018, 美东)
这班上几只舔共的五毛真是人不要脸天下无敌
白修德的Thunder Out of China全文
网上到处都是,上面清清楚楚写了河南3000万人,
https://archive.org/stream/thunderoutofchin031761mbp/
thunderoutofchin031761mbp_djvu.txt
Thunder Out of China
London
Victor Gollancz LTD
"Honan is a fertile province. Before the war, it supported some
30,000,000 people, who farmed the rich loess soil exhaustively
and pres... 阅读全帖 |
|
|
|
l****z 发帖数: 29846 | 23 By EDWARD WONG
YAN’AN, China — The explosives had been set, the watchtower manned and
the dirt battlefield cleared of rubble. Communist soldiers armed with
rifles took up positions at the foot of the barren hills. Their foes, the
Kuomintang, loomed in the distance, advancing on the garrison town of Yan’
an.
炸药装好了,人也上了瞭望塔上,泥土战场上清除了垃圾。荒山脚下,紧握步枪的共产
党士兵已经摆好架势。敌人国民党在远方出现,向军事重镇延安进发。
Then someone yelled, “There’s no electricity!”
忽然,有人喊:“没电了!”
No electricity meant no show.
没电,表演就没戏了。
Hu... 阅读全帖 |
|
b*********y 发帖数: 1 | 24 Faculty opening in the Department of Geotechnical Engineering,
Tongji University (Shanghai, China)
THE GROUP OF SOIL MECHANICS AND PROBLEMATIC SOILS
The Department of Geotechnical Engineering, Tongji University is equipped
with the nation’s premier science and engineering facility for soil & rock
mechanics, foundation engineering, underground engineering and geological
engineering. The Group of Soil Mechanics and Problematic Soils consists of a
world-class team of researchers working on cutting-... 阅读全帖 |
|
l*******r 发帖数: 3799 | 25 you first need to smooth your data by local fitting (loess()), and use a
function from pastecs library to find the turning points, then compare the
position of turning points.
Well, not one line code, but it is pretty straight-forward. The tricky
thing is to tune the parameter. |
|
c*********5 发帖数: 23 | 26 博雅论坛第八讲: 针对中国农村教育困境的尝试
—滋根的中国实践与匹夫有责
Experimental Solutions to Education in Rural China
– A Case Study of Zigen and How You Can Make an Impact
Speaker:
Pat Yang, Founder and President of the Zigen Fund
Dongjin Cai, Deputy Executive Director of the Zigen Fund
Time: 2:00-4:00pm, November 5th, 2011
Location: Lecture Hall D, Science Center, Harvard University, 1 Oxford
Street, Cambridge, MA
Agenda: 2:00 – 2:10 Speaker Introduction Host: Ruixi Hao
... 阅读全帖 |
|
s*******y 发帖数: 46535 | 27 I'm a big fan of this book;
I'm cautiously excited about the movie too, can't wait to see it.
I may be biased, but men and women cultivated by the loess plateau are the
backbone of Chinese spirit |
|
f**********e 发帖数: 1994 | 28 我是看到你说到你是用 freehand curve 来建立 model (估计是平滑化的 freehand
curve),再用这 curve 来画图/判明关系。于是我就想起了 Bezier curve。其实你在
画 freehand curve 时就已经在作很多的平滑化了,而这个对机器而言是不容易做的事
,如果把这些带有大量噪声的非平滑数据点喂进 spline 等的曲线算法,第一会算死,
第二是你会得到很疯狂的曲线。如果是要用 non linear least square, 你还得先知道
函数形式,以及大约的参数范围。最小化 error function 时还可能掉进 local
minima,到时候他会被你们搞死。(dev 的人要写一个输入函数的对话框,建立一个函
数的输入形式,还要调试很多次确定他的 minimizer 不会乱 fit。。。)要我我也只
给你一个 linear model, 最多给个 LOESS model。:) |
|
|
|
a**r 发帖数: 38 | 31 You are welcome on Oct.21
http://kresgeeye.org/research/ligon-research-center-of-vision/
Kresge Eye Institute, in association with the Anatomy/Cell Biology
Department, is organizing its second annual Vision Research Workshop on Oct.
21. This workshop highlights research accomplishments of our graduate
students, postdoctoral fellows, residents and clinical fellows. The goal is
to provide an outstanding opportunity for the vision community on the WSU
campus to interact with each other and exchange... 阅读全帖 |
|
A**H 发帖数: 4797 | 32 您这云里雾里的我不知所云啊。。。
Oct.
is |
|
s**d 发帖数: 148 | 33 【 以下文字转载自 Statistics 讨论区 】
发信人: suod (suod), 信区: Statistics
标 题: 各种平滑函数评价?
发信站: BBS 未名空间站 (Sat Aug 10 16:19:09 2013, 美东)
对时间序列,采用不同的线性平滑函数,比如Moving average, loess, Kalman, etc。
是否有系统的方法对这些不同的函数的效果进行评价?
谢谢。 |
|
s**d 发帖数: 148 | 34 【 以下文字转载自 Statistics 讨论区 】
发信人: suod (suod), 信区: Statistics
标 题: 各种平滑函数评价?
发信站: BBS 未名空间站 (Sat Aug 10 16:19:09 2013, 美东)
对时间序列,采用不同的线性平滑函数,比如Moving average, loess, Kalman, etc。
是否有系统的方法对这些不同的函数的效果进行评价?
谢谢。 |
|
|
|
h*********o 发帖数: 151 | 37 楼上的大大,你是对的,我在fit的时候没有加 data frame, 改正过来以后就没有
问题了,不好意思,我对这structure不熟悉。
不过 predict 的结果是一个矩阵,第一列是x,第二列是z,是不是应该把这两列加
起来,才是fitted value啊?
还有就是stats下面的loess是一样的做法么?它的预测函数是predict(object.lo,data
),我试了一样的做法,把data frame都弄成一样的,但是结果却仍然是1000个Y。这
是怎么回事呢? |
|
t******l 发帖数: 32 | 38 (LOESS) local polynomial regression. The coefficient for the linear term is
the estimate for the regression function. |
|
|
t*********l 发帖数: 778 | 40 请教两个问题:
1)有算法解决这个问题吗?自己从头写code是否值得?
2)有现成的资源可以解决这个问题吗? 我查的结果是SAS里的loess可以做,还有MSSQL
里好像也有
现成的算法。两个我都没有用过。
感谢做data mining的大侠指教。 |
|
T*******I 发帖数: 5138 | 41 你这段陈述里没提什么问题啊。仅仅隐含了一些提问的要素。我很难一下全部归纳出来
。所以无法回答你。
关于overfitting和validation的问题,我的基本态度依然是那样的。在我建议的三分
回归分析法中,每个临界点是一个加权的期望估计,意味着只有对应着这个期望的临界
点集合的三分模型才是期望的三分模型。它是在全样本空间的基础上得到的一个充分估
计。
如果说由LOESS法中的locally weighting得到的永远是一套非充分的统计量,那么,这
样的临界模型是需要被validated的,但我的方法给出的结果不是这样的。
正如我问过精算兄的那个问题:推崇CV的人如何从逻辑上解释一个非充分的统计模型(
即training model)与一个充分统计模型(即全样本模型)间的差异,为什么我们要化
大气力对一个非充分的统计模型做validation? 而不直接建一个充分的统计模型?这个
问题怎么解释?
其实,在你提出的下面的例子中,TA给分和教授因TA无法履行职责不得不自己给分是可
以定义出两个不同的“总体”的。
you
you
should include the covariate... 阅读全帖 |
|
l***a 发帖数: 12410 | 42 sas目前threads enabled procedure有
Base SAS engine indexing
Base SAS procedures: SORT, SUMMARY, MEANS, REPORT, TABULATE, and SQL
SAS/STAT procedures: GLM, LOESS, REG, ROBUSTREG.
我不确定它们是不是trivial的。。。我是现在的疑问是,按照前面那个paper的方法试
验,不管是不是threads enabled的proc在运行效率上都没有提高,那这些paper讲解的
什么 rsubmit/endrsubmit 有什么用
功能 |
|
d********p 发帖数: 31 | 43 有一组遗传学数据, x-axis 是染色体位置, y-axis 是相应的数值, 理论上y值是恒
定的(=0), 除非某染色体位置有某种遗传学功能,这时会有峰值出现。我要找的就
是这些峰。现在我的数据在图上显示一些local trends。我想去除这些trends,使得总
体上均值是straight line。我的问题是:
1. 是用loess还是local mean 做 normalization, 用什么R package?
2. 如何计算每个峰显著性的p-value?t-test, resampling
多谢回复。 |
|
|
c********d 发帖数: 253 | 45 R中的lowess和loess function可以做的。你用R help查一下怎么用就可以了。
包子plz。 |
|
w******e 发帖数: 142 | 46 data mining的东西以及他们的使用实际的例子。financial time series的东西可以看
一下,然后如果有空可以看一下economic forecast的一些东西,不过很多东西和前面
的两个是重复的,相当于具体应用。其实我个人感觉你面试的时候给他们吹点如何用
data mining的东西来来完成他们信用评估的模型,然后再扯点非线性的模型,比如
loess类似的,哪怕你没有用过拿出来吓人也会很有用,因为他们也没有用过,呵呵,
但是听起来很酷。 |
|
|
w*******9 发帖数: 1433 | 48 Don't know how loess could account for the correlation. I think the random
coefficient regression proposed by 2L is more efficient. |
|
s**d 发帖数: 148 | 49 对时间序列,采用不同的线性平滑函数,比如Moving average, loess, Kalman, etc。
是否有系统的方法对这些不同的函数的效果进行评价?
谢谢。 |
|
g******i 发帖数: 118 | 50 mgcv是个很牛x的package, 能做很多很fancy的事情。有需要的话你可以慢慢挖掘。
总的来说,不论是用mgcv里gam,还是用Local linear kernel regression,loess, 他
们不应该有太多差别的。如果后者准确度好很多,十有八九是Kernel的bandwidth设的
比较小,偏向over smooth 罢了。gam里面默认knots之类的也可以调节,应该也能达到
Kernel的效果。
不知道你的prediction是不是in sample prediction. 如果是的话,这种比较是没有意
义的,你永远可以Overfit来提高。gam里面用了cross validation来选择smooth程度,
应该还算比较可信。我就不知道kernel regression有没有用CV。
我个人偏好用gam,用那些spline。视觉效果也会比local linear之类好一些。
model |
|