由买买提看人间百态

topics

全部话题 - 话题: bootstrap
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
b******3
发帖数: 4385
1
目的:(1)预测单位体积的某种液体中某种细菌的数目,(2)选定一个体积为x的样本进
行测量所对应的variance
数据:由于特殊原因只有了7个样本结果(每个样本体积大小不等,知道体积和细菌数
目)
想用bootstrap 来解决,但是不知道如何处理这种每个数据点的体积不一样的情况,请
问哪位大侠能指引一下,不甚感激!!
r********n
发帖数: 6979
2
每个体积不一样无所谓啊
你要的不是单位体积液体中的细菌数目么
每个样本先算出单位密度
然后对7个样本bootstrap
mean还好
用7个样本估计variance
CI会很大吧
我反正是不会相信的
v*******e
发帖数: 11604
3
就像2楼说的那样做就行了。另外不知道你用bootstrap是啥意思,7个数据点,求mean
和variance是简单计算就行了。
j*****e
发帖数: 182
4
Please check the topic of Poisson Rate Regression in the Agresti's book. In
SAS PROC GENMOD, this can be implemented by
model count=/dist=Poi offset=log_volumn;
Bootstrapping is certainly not the solution.
n*****n
发帖数: 3123
5
来自主题: Statistics版 - bootstrapping 怎么做validation?
用没有取到的做validation. 不过standard error很难估计
google .632+ bootstrap
C****4
发帖数: 110
6
来自主题: Statistics版 - bootstrap、线性拟合的顺序? (转载)
【 以下文字转载自 Physics 讨论区 】
发信人: Ckt624 (曹康泰), 信区: Physics
标 题: bootstrap、线性拟合的顺序?
发信站: BBS 未名空间站 (Fri Aug 7 03:18:12 2015, 美东)
有3个带误差棒的点,求截距及其误差。一种方法是每次由三个点对应的正态分布拟合
一条直线,做10000次,求这10000条直线的截距的误差、平均值。
那么,我能不能直接由这三个分布分别形成10000个点,再做一次线性拟合得到截距及
误差?
J*X
发帖数: 1001
7
来自主题: Statistics版 - 請問某種bootstrap的名稱和reference
你叫这个id也会来问这种问题?问的有点笼统,non-parametric bootstrap?
p********a
发帖数: 5352
8
☆─────────────────────────────────────☆
TNEGIETNI (lovewisdom) 于 (Tue Oct 11 20:01:18 2011, 美东) 提到:
朋友告诉我说他要来,还有Harvard的Carl Morris等,$200的Registration fee对我来
说不是一笔小数目。我其实并不欣赏他的bootstrap法,曾公开批评过这个方法的逻辑
错误。如果去,我跟他讲什么呢?版上的恶朋好友可否给点建议?谢谢。
☆─────────────────────────────────────☆
angelsun (安吉笋) 于 (Tue Oct 11 20:38:46 2011, 美东) 提到:
在哪里?什么时候?讲座是什么topic的?

☆─────────────────────────────────────☆
statcompute (statcompute) 于 (Tue Oct 11 23:51:23 2011, 美东) 提到:
$200 for a lecture by Efron? it i... 阅读全帖
p********a
发帖数: 5352
9
☆─────────────────────────────────────☆
DaShagen (Unbearable lightness) 于 (Sat Aug 27 12:34:44 2011, 美东) 提到:
发信人: Dreamer (不要问我从哪里来), 信区: Dreamer
标 题: cs相关的专业其实比不过统计(慎入)
发信站: BBS 未名空间站 (Fri Aug 26 16:09:21 2011, 美东)
不发在stat版了,省的吵
我之前是做生物物理的,搞了很多没用的model,后来quit了PhD转的统计
目前统计找工作肯定是不如cs的好找,这一点无可争议。但是统计这个行业有很多眼下
看不到的优点,比方说越老越吃香。很少看到学cs的人过了30还有热情编程的,过了30
的人编程纯属是靠着自己那点残存的记忆和经验在挣扎。而且cs这种东西找个培训学校
注册个training program学两天什么csharp php就能工作了,实在没什么核心技术,年
轻人一上来立刻把老程序员赶跑。统计就不一样了,根据不同的案例有不同的分析和解
决方法,很多时候需要随机... 阅读全帖
g****n
发帖数: 3313
10
【 以下文字转载自 SanFrancisco 讨论区 】
发信人: gpsfan (八戒,削她!善了个哉的!), 信区: SanFrancisco
标 题: Re: 【JOBS】11.01 -- 11.30
发信站: BBS 未名空间站 (Fri Nov 18 02:52:59 2011, 美东)
以下职位,如果是名校,高分,申请把握会大增,经过内部推荐后,不需要HR
SCREENING, 直接面试。
年底机会不多,大家抓紧。
EMAIL 简历到:GPSFAN#GMAIL.COM
Office Coordinator
The Role:
Company Concierge, a full-time superstar responsible for helping to run the
day-to-day office operations of a fast-growing technology company.
This is no ordinary admin job:
Historically, it has been the entry point to the comp... 阅读全帖
g****n
发帖数: 3313
11
来自主题: SanFrancisco版 - 【JOBS】11.01 -- 11.30
以下职位,如果是名校,高分,申请把握会大增,经过内部推荐后,不需要HR
SCREENING, 直接面试。
年底机会不多,大家抓紧。
EMAIL 简历到:GPSFAN#GMAIL.COM
Office Coordinator
The Role:
Company Concierge, a full-time superstar responsible for helping to run the
day-to-day office operations of a fast-growing technology company.
This is no ordinary admin job:
Historically, it has been the entry point to the company for smart, dynamic
working students, recent grads, and people re-entering the workforce. Admin
team members have gone on to work in other parts of ... 阅读全帖
g****n
发帖数: 3313
12
具体讨论或有问题:
https://www.facebook.com/groups/CCCN.CMAIN/
以下职位,如果是名校,高分,申请把握会大增,经过内部推荐后,不需要HR
SCREENING, 直接面试。
强调一下啊,要名校,英语要好,GPA 要好,这个我没办法,是公司的文化。
年底机会不多,大家抓紧。在美国之外的同学就先别折腾申请了。虽然公司支持H1B
EMAIL 简历到:GPSFAN#GMAIL.COM
Office Coordinator
The Role:
Company Concierge, a full-time superstar responsible for helping to run
the
day-to-day office operations of a fast-growing technology company.
This is no ordinary admin job:
Historically, it has been the entry point to the company for smart,
dynamic
working stu... 阅读全帖
h***s
发帖数: 1716
13
这个问题的产生是因为你拒绝接受bootstrap法,所以,你必须给出关于那个反命题的
证明或阐述。统计学界已经接受这个东西,而且是经过了专业人士反复,带批判性的审
核和检验了的(理论和试验意义上的),因为很多专业人士都意识到bootstrap法的逻
辑性和合理性,即使持合理怀疑态度的专业人士也明白这一点。
统计学界根本就没有大多数会认为,你的那个命题需要首先得到解决,除了你自己以外
。这也不会是一个基本的概率论的命题。在没有解决之前,你接不接受bootstrap法根
本不要紧。因为,几十年后,bootstrap法肯定会有很多创新的发展和进步,而你颠覆
bootstrap法的狂妄臆想任然会和几十年前的今天一样,没有任何结果。
综上所述,我已经解释了,虽然没有严格证明,你颠覆bootstrap法的狂妄臆想会和放
屁一样,在空气中出现然后消散,如此反复循环,几十年如一日。
d***d
发帖数: 99
14
唉,懒得说你了。随手贴一点wiki上粗浅的东西,你看看吧。我觉得你的思路太狭隘了
。and i don't know what exactly want to achieve.
Situations where "Bootstrapping procedures" are useful
Adèr et al.(2008) recommend the bootstrap procedure for the following
situations:
When the theoretical distribution of a statistic of interest is
complicated or unknown. Since the bootstrapping procedure is distribution-
independent it provides an indirect method to assess the properties of the
distribution underlying the sample and the parameter... 阅读全帖
T*******I
发帖数: 5138
15
这个问题的产生是因为你建立或接受了bootstrap法,所以,你必须给出关于那个命题
的证明或阐述。我没有接受这个东西,因为我意识到那个命题需要首先得到解决。这是
一个基本的概率论的命题。在没有解决之前,我是不会接受它的。
现在,让我来试着论证一下那两个概率空间是否相等:
根据定义,我们已经有
概率空间A=来自总体E的一个原始样本所表达或构成的概率空间。
概率空间B=基于A上的反复抽样所得的Bootstrapped样本统计量所表达或构成的概率空间。
所以,如果假设
概率空间A = 概率空间B
那么,就有
来自总体E的一个原始样本所表达或构成的概率空间A = 基于A上的反复抽样所得的Bootstrapped样本统计量所表达或构成的概率空间B
要满足这个等式,必须满足以下条件:
来自总体E的一个原始样本 = 基于这个原始样本上的反复抽样所得的Bootstrapped样本统计量构成的一个集合A'
也即
A = 基于A的Bootstrapped样本统计量构成的集合A'
如果考虑到A中的各样本点收敛到其期望E(A),方差收敛到V(A),那么,我们只能期望A'中的各点也... 阅读全帖
o******e
发帖数: 1001
16
来自主题: JobHunting版 - 招Java Developer (NY/NJ)
是朋友的公司的,感兴趣的话直接和他联系。
------------------------------------------
Java (Angular/BootStrap) Developer(who speaks fluent Chinese)
#:15-00109 Title: Java (Angular/BootStrap) Developer - Speak fluent Mandarin
Location : Secaucus, NJ
Position Type : Direct Placement

Description:
Our client, a Major Entertainment Company with a huge International Digital
& Broadcast presence is seeking a Java Developer to join their team
interacting daily with their team in China. MUST SPEAK FLUENT MANDARIN
CHINE... 阅读全帖
o******e
发帖数: 1001
17
来自主题: NewYork版 - 招Java Developer (NY/NJ) (转载)
【 以下文字转载自 JobHunting 讨论区 】
发信人: onehouse (万物皆势,无道常驻。), 信区: JobHunting
标 题: 招Java Developer (NY/NJ)
发信站: BBS 未名空间站 (Wed Apr 29 22:12:30 2015, 美东)
是朋友的公司的,感兴趣的话直接和他联系。
------------------------------------------
Java (Angular/BootStrap) Developer(who speaks fluent Chinese)
#:15-00109 Title: Java (Angular/BootStrap) Developer - Speak fluent Mandarin
Location : Secaucus, NJ
Position Type : Direct Placement

Description:
Our client, a Major Entertainment Company with a huge International Digita... 阅读全帖
g*****g
发帖数: 6798
18
2011年最受欢迎的五款Web开发工具
2011-12-09 09:37 | 2539次阅读 | 来源:ReadWriteWeb 【已有3条评论】发表评论
关键词:Web开发工具,开发者,开发工具 | 作者:Joe Brockmeier | 收藏这篇资讯
虽然基于浏览器的操作系统还未“雄霸天下”,但对Web开发者来说2011年无疑是“风
景不错”的一年。这是一个适合Web开发的“美好时代”,有很多有史以来最好的开发
工具可供使用,下面我们将介绍五款2011年最受欢迎的Web开发工具:
1.jQuery和jQuery Mobile
jQuery是一款免费且开放源代码的JavaScript代码库,而jQuery Mobile是jQuery在手
机和平板上的版本。jQuery Mobile不仅能给主流移动平台带来jQuery核心库,还能发
布一个完整统一的jQuery移动UI框架,支持全球主流的手机、平板、电子阅读器、台式
电脑等平台。据微软关于jQuery的调查显示,jQuery在受访网站中的使用率已从2010年
12月的27%上升到2011年12月的42%。
2.CSS3 PIE
CSS... 阅读全帖
l**********n
发帖数: 8443
19
来自主题: Programming版 - angular是否淘汰jquery了
I have a question of bootstrap. Once I include the bootstrap.css, the entire
website is in the style of bootstrap. The thing bad about it is that if I
use another library that requires its own css, the css is messed up by the
styles imported from bootstrap. Although I can fix it by adding more css, I
found it is stupid to do so.
Sometimes, I found writing a css rule is too general is a bad way, such as
defining a css rule like:
select {
}
.left{
}
all those are too general.
d*******r
发帖数: 3299
20
来自主题: Programming版 - AngularJS vs Dojo
我前端菜,才开始学,
AngularJS 是和 JQuery 不太兼容,最好别一起用,
但是 AngularJS 和 BootStrap 的 CSS 部分不冲突,可以一起用。
用 BootStrap 时候,只用 CSS 部分,JQuery 和 UI 控件部分用一个有名的3rd lib
来做:
http://angular-ui.github.io/bootstrap/
bootstrap 和 AnguarJS 关系我也是才搞懂,上面说错了的话,请前端大牛指正。

niu
h***i
发帖数: 3844
21
先问个简单的,谈一下bootstrap吧,classical bootstrap 可以达到几阶的accuracy?
然后 smoothed bootstrap ? 帮我写一下 edgeworth expansion? dependent data据
说很常见,在dependent 的情况下,写一下edgeworth expansion?
empirical likelihood 据说很好用,能否讲一下,结合一下bootstrap,也来谈一谈?
就问你这么多吧。。。。除了自信,你统计最强在哪里?
a********a
发帖数: 346
22
来自主题: Statistics版 - R memory urgent help
No, I can not divide smaller unit than I am using now since I want to run
200 bootstraps one time, but now I only run 1 bootstrap, no way to run half
bootstrap. The problem is it stopped without finishing one bootstrap.
T*******I
发帖数: 5138
23
请问,以下对Bootstrapping法的描述是正确的吗?
In statistics, bootstrapping is a computer-based method for assigning
measures of accuracy to sample estimates (Efron and Tibshirani 1994). This
technique allows estimation of the sample distribution of almost any
statistic using only very simple methods (Varian 2005).[1] Generally, it
falls in the broader class of resampling methods.
Bootstrapping is the practice of estimating properties of an estimator (such
as its variance) by measuring those properties when samp... 阅读全帖
k********g
发帖数: 56
24
你提出一个比bootstrap好的方法,然后用它分析一个数据,写出数据分析结果,再分
析为什么这些结果能说明你的方法比bootstrap好,如果说得通,你就赢了。不对,只
要你敢写出数据分析的结果,你就赢了。
我最后强调一遍,我引用box的话意思是说,我们现在假设bootstrap理论上就是一坨屎
,理论基础完全不成立,它有罪,就该死。假设你的批评全都对。
但它在数据分析实践中很方便,很有用,得到了对其他学科有用的被实践证实的结果,
但凭这一点,bootstrap就有功,在没有更好的方法之前不可被取代。
就好比你坐飞机,在飞行中你发现飞行员尽管很有经验,但你就觉得他很烂。在你能找
到其他更好的飞行员替代他之前,你不能把他从飞行员的位置上推下来打死,除非你想
马上去见你的上帝。

误。
T*******I
发帖数: 5138
25
其实,Bootstrap使用起来不是很方便,有很大的主观人为性,而且存在着这样的一个问题:
我们可以将从原始样本中反复抽取的样本合并为一个单一的样本吗?答案显而易见是肯定的,因为此时的原始样本成了你的抽样“总体”,由于抽样是replable,如果你设定抽样次数为5000次,那么,原始样本中的每一个独立个体都将有5000次机会被抽到。如果合并这5000个bootstrapped的样本,你可以预见到这个合并结果会是怎样的情形,也就是把原始样本的
sample size扩大了5000倍。这是否有点crazy?
反之,如果你认为那5000个bootstrapped的样本不可合并,那你就是在颠覆整个统计学的最
核心的概念基础。
今年7月在JSM会议上我与一位华人PhD统计学家谈到过我对最优化、强制连续性以及Bootstrap法等的批判性观点,他大为吃惊地说:我们从来没有像你这样思考过问题,也从未怀疑过这里会有什么问题!我想,在此发言的各位也许与他类似。你们缺乏怀疑和批判的精神。
i**********k
发帖数: 5274
26
只有你这80-20的傻逼相信这个NBC搞出来的民调。NBC的民调属于C级民调,连
realclearpolitics都不加入的。
这个民调加了10%以上为未注册为选民的人,都不管他们是从哪里来的。当然对希拉里
有利了。
Ken • an hour ago
It's a self-selected survey sample. Anyone can claim to be anything and take
the survey without regard to accuracy. Read the methodology section:
"Because the sample is based on those who initially self-selected for
participation rather than a probability sample, no estimates of sampling
error can be calculated. All surveys may be subject to multiple sources of
er... 阅读全帖
w*f
发帖数: 4
27
来自主题: Classified版 - Project Based Freelance Web Developer
加州尔湾公司现招募一名WEB Developer, Project Based:
Requirements:
- LAMP stack expert (specifically PHP and MYSQL)
- Familiar to setup the system from scratch at the web hosting to make WP
site live.
- WordPress savvy, at least 3+ years experience working with WP
- Bootstrap must. Must been able to work from PSD files to build bootstrap
theme for WordPress.
- Experience building custom jQuery/JavaScript/AJAX functionality.
- Bilingual Chinese/English is a plus.
* This is project based job, Successful and s... 阅读全帖
q*******i
发帖数: 353
28
来自主题: JobHunting版 - 求内推湾区CS职位
美国CS master毕业,现在relocate 到湾区,希望在这边能找CS相关职位,希望哪位好
心人内推(尤其看到amazon最近出了很多湾区职位,不知道有没有amazon的兄弟姐妹帮
个忙)。
CS基础课程基本满分GPA,硕士的thesis是用CUDA做金融方面VaR(value at risk)的加
速,除了CS master的课程学习和project经验,还自己学习了coursea上面几个web
programming还有andriod的课程,做过数个project, 附上自己的project 简介,所有
代码都可以在https://github.com/zzMOM查看。 使用过的语言包括Java, JavaScript,
C,HTML, CSS, SQL,使用过的platform包括Android, GitHub, HeroKu, Node.js, AWS,
Bootstrap, CUDA (GPU programming), MySQL, PostgreSQL, ArcGIS, ERDAS,
Eclipse, Emacs, Vim, 目前也在刷leetcode和CC150.... 阅读全帖
w*f
发帖数: 4
29
来自主题: JobMarket版 - Project Based Freelance Web Developer
加州尔湾公司现招募一名WEB Developer, Project Based:
Requirements:
- LAMP stack expert (specifically PHP and MYSQL)
- Familiar to setup the system from scratch at the web hosting to make WP
site live.
- WordPress savvy, at least 3+ years experience working with WP
- Bootstrap must. Must been able to work from PSD files to build bootstrap
theme for WordPress.
- Experience building custom jQuery/JavaScript/AJAX functionality.
- Bilingual Chinese/English is a plus.
* This is project based job, Successful and s... 阅读全帖
w*f
发帖数: 4
30
来自主题: LosAngeles版 - Project Based Freelance Web Developer
尔湾公司现招募一名WEB Developer, Project Based:
Requirements:
- LAMP stack expert (specifically PHP and MYSQL)
- Familiar to setup the system from scratch at the web hosting to make WP
site live.
- WordPress savvy, at least 3+ years experience working with WP
- Bootstrap must. Must been able to work from PSD files to build bootstrap
theme for WordPress.
- Experience building custom jQuery/JavaScript/AJAX functionality.
- Bilingual Chinese/English is a plus.
* This is project based job, Successful and str... 阅读全帖
c********g
发帖数: 1173
31
来自主题: PhotoGear版 - 问个nginx rewrite的问题 (转载)
这儿牛人多,转过来哪位高手帮忙看看。
【 以下文字转载自 Linux 讨论区 】
发信人: cosmorning (Sleeping pig), 信区: Linux
标 题: 问个nginx rewrite的问题
发信站: BBS 未名空间站 (Thu Feb 14 23:33:19 2013, 美东)
现在要把URL:http://www.example.com/product/product-name/1234 forward到:http://www.example.com/details/product.jsp?pid=1234,希望用户端browser里看到的URL仍是第一个。我用了这个rewrite rule:
rewrite ^/product/(.*)/(\d+)$ /details/product.jsp?pid=$2;
但是,在product.jsp里,有一个指向css文件的连接:

bootstrap.css 所在目录是: /usr/sha... 阅读全帖
f*****Q
发帖数: 1912
32
$ man rc
RC(8) BSD System Manager's Manual RC(
8)
NAME
rc -- command script for boot
SYNOPSIS
rc
rc.local
DESCRIPTION
Prior to Mac OS X 10.5, the rc script was used to bootstrap the OS. As
of
Leopard, the system is self-bootstrapped via launchd(8) which uses the
launchctl(1) bootstrap subcommand to read in launchd jobs from the stan-
dard locations. For compatibility reasons, the rc.local script still
continues to wo
c********g
发帖数: 1173
33
来自主题: Linux版 - 问个nginx rewrite的问题
现在要把URL:http://www.example.com/product/product-name/1234 forward到:http://www.example.com/details/product.jsp?pid=1234,希望用户端browser里看到的URL仍是第一个。我用了这个rewrite rule:
rewrite ^/product/(.*)/(\d+)$ /details/product.jsp?pid=$2;
但是,在product.jsp里,有一个指向css文件的连接:

bootstrap.css 所在目录是: /usr/share/nginx/www/docs/assets/css/ . 当我用了
上面的rewrite rule之后,root directory不知问什么就变成了 www/product, 所以
在 details/product.jsp里 bootstrap.css 的连接就变成了:
/usr/share/n... 阅读全帖
b***k
发帖数: 2673
34
☆─────────────────────────────────────☆
sbtim (15#) 于 (Wed Sep 5 10:41:11 2007) 提到:
因为一个有限的采样数据中存在outlier,
为了得到更为可靠的distribution的location, scale估计值,
想采用bootstrap方法,
只是不确定这样产生的simulation samples, 会
不会使得估计出的statistics (mean, median, variation, quantiles)
与初始sample得到的statistics估计值有很大偏差?
请大家不吝赐教。
多谢了先。
☆─────────────────────────────────────☆
arnaud (Prrrrrf) 于 (Wed Sep 5 11:18:51 2007) 提到:
bootstrap方法要在现有样本基础上重新抽样,这个resampling过程有很多研究,根据数
据特征,可以分别采用传统bootstrap(iid),moving blocks boot(depe
e**l
发帖数: 62
35
来自主题: Quant版 - 咨询一门课程的有关内容
“ST4231 Computer Intensive Statistical Methods
Empirical distribution and plug-in principle, general algorithm of bootstrap
method, bootstrap estimates of standard deviation and bias, jackknife
method, bootstrap confidence intervals, the empirical likelihood for the
mean and parameters defined by simple estimating function, Wilks theorem,
and EL confidence intervals, missing data, EM algorithm, Markov Chain Monte
Carlo methods.”
想请了解st的人说一下这门课程对于fiancial engineering的学生有学的必要么 和
fiancial modeling以
c*********n
发帖数: 128
36
我的starting point是还没有bootstrap的rate instrument(Libor,Future,FRA,
swap)。
我觉得如果不考虑term strucutre,把每一个rate instrument(比如3m Libor,5yr
swap)拿出来单独处理它自己的time series,这个应该就跟equity time series里面
清理数据是一样的。
但是如果考虑到rate curve是term structure,是不是可以做得更好一些?比如某个点
的存在导致bootstrap的结果不正常(在spot curve上表现为某处有个点不连续,如果
是bootstrap成forward curve,会导致局部oscillation),就说这是个坏点。
如果能把两个结合做一个cross examination,是不是就能做得更精确?
发现坏点之后的处理应该不难,直接把那个点剔除就行了吧?curve 少一两个点不是什
么大问题。

是坏
e**l
发帖数: 62
37
“ST4231 Computer Intensive Statistical Methods
Module description: Empirical distribution and plug-in principle, general
algorithm of bootstrap
method, bootstrap estimates of standard deviation and bias, jackknife
method, bootstrap confidence intervals, the empirical likelihood for the
mean and parameters defined by simple estimating function, Wilks theorem,
and EL confidence intervals, missing data, EM algorithm, Markov Chain Monte
Carlo methods.”
想请了解st的人说一下这门课程对于fiancial engineering的学生有学的必要么
e**l
发帖数: 62
38
“ST4231 Computer Intensive Statistical Methods
Module description: Empirical distribution and plug-in principle, general
algorithm of bootstrap
method, bootstrap estimates of standard deviation and bias, jackknife
method, bootstrap confidence intervals, the empirical likelihood for the
mean and parameters defined by simple estimating function, Wilks theorem,
and EL confidence intervals, missing data, EM algorithm, Markov Chain Monte
Carlo methods.”
想请了解st的人说一下这门课程对于fiancial engineering的学生有学的必要么
j*****e
发帖数: 182
39
If your sample size is large enough, you can use delta method to construct
the CI. This method even allows correlation between your numarator and
denominator.
If the sample size is small, you need to use bootstrap. There are different
ways to bootstrap, some are better than the others. You can refer to Davison
's bootstrap book for details.
T*******I
发帖数: 5138
40
来自主题: Statistics版 - Re: 关于肖手术的最新review (转载)
理解我的理论和方法论所需的概念都在我的那篇被大家嗤之以鼻的文章里。如果你也是
其中之一者,如果你真想理解它们,你就去读那篇paper,读完后自然会明白为什么我在
统计学中(而不是数学中)从理论上否定最优化、为什么我可以从理论上批驳bootstrap、
以及为什么我说spline从统计理论上说是不可接受的。
例如,要理解bootstrap的理论错误,需要有关于“随机变量的唯一性”这个思想来指导
,也就是说,两个随机变量相等,当且仅当它们的可测空间一致且密度函数一致。于是
,我们就知道Bootstrap在方法论上偷换了认知对象(altered the original object)。
再如,要理解最优化的理论错误,简单到只需考察身高与体重这两个随机变量的观察值
之间的随机对应关系,以及它们的期望之间的唯一且确定的对应关系。这些关系将启示
我们,最优化的临界模型不是我们所期望的模型。期望临界模型的集合唯一且确定地对
应着期望临界点的集合。
于是,为了论证上述两个问题,我们需要关于随机变量的9个性质以及关于统计学的6 -
7个公理性陈述。因此,理解了这些概念之间的关系,新的理论体系就建立起来
T*******I
发帖数: 5138
41
嗯,你说的有道理。如果我去了,要么就是老老实实地坐在下面听那些教授们高谈阔论
,听完后不管听懂没有走人了事;要么就是走上去对Dr. Efron说:“我觉得您的
Bootstrap法涉嫌无意识地更改了统计认知的对象,因为一个基于原始随机测量或变量
上的Bootstrapped distribution的概率密度函数显然不等于原始变量的分布的概率密
度函数,由此定义在上述两个空间上的统计量不是同一的。”如果我说对了,那么,他
的Bootstrap法就可能失去意义;而如果我说错了,也没什么大不了的,因为我不过是
一个医学背景毕业的master水平搞数据分析的工匠,既伤不了他,也伤不了我自己。
A*******s
发帖数: 3942
42
r u able to read these? i doubt that...
Bootstrap Methods: Another Look at the Jackknife
B. Efron
Bootstrap Methods for Standard Errors, Confidence Intervals, and Other
Measures of Statistical Accuracy
B. Efron and R. Tibshirani
Some Asymptotic Theory for the Bootstrap
PJ BIQKEL
T*******I
发帖数: 5138
43
你的这个回答是不诚实的。
你的手中只有一个来自总体的原始样本,你为什么要对这个原始样本反复抽样?你想得
到什么呢?例如,如果你认为原始样本取样不好,偏离了自己的预期,于是你就搞
bootstrap,试图用这个方法来弥补与你的预期之间的误差。由于你缺乏针对总体的进一
步操作,就只好引入你的假设,以便使得bootstrap的结果朝向你的预期。这个认知过
程会带给人们什么结果?你知道,我也知道。
算了,关于Bootstrap的讨论就此打住。我也许需要重新思考一些问题。
T*******I
发帖数: 5138
44
我知道。你没看我的全文。现行的Bootstrap不会将那5000个bootstrap的样本合并为一
,而是分别对每个样本计算目标统计量。
我之所以那样说是由于根据所有bootstrapped样本的“总体=原始样本”的来源的一致
性、可放回式抽样的完全随机性以及集合的可加性它们可以合并为一个单一的大样本。
w*******a
发帖数: 2409
45

爷可没上来用半吊子统计知识去教育别人什么是bootstrap。你刚才对大师bootstrap的
评论恰恰显示了你的水平。除了bootstrap您不也常对别的东西品评论足么?都不明白
这些二把刀都显摆啥,早晚给炖乌鸡了。。。
s******h
发帖数: 539
46
来自主题: Statistics版 - 请教个计算standard error的问题
如果你问的是square root of sample variance of A_i/(\bar B), 那么可以直接用
sample variance的公式。
但我相信你问的可能不是这个,而是var(A_i/(\bar B) 的 estimator. 特别是你只有
10个数据的情况下,asymptotic results may not hold (otherwise, since \bar B \
to E(B_i) w.p.1, you can show that var(A_i/(\bar B_n)) \to var(A_i)/E^2(B_i)
).
For finite sample, If A and B are independent, then var(A_i/\bar B)
= var(A_i)*E(1/\bar B^2). You can estimate var(A_i) using its sample
variance and for E(1/\bar B^2), unless you have distribution assumptions (e.
g.... 阅读全帖
r******g
发帖数: 286
47
上周一电话面试Statistican位置,半个小时,3个人面。今天收到HR信,挂了。
面试开始为了很多Behavior问题,问了为什么转行,问题都能handle。 最后一中国
人(挂manager)问我简历上两个问题:bagging和boosting,我对这两个概念的解释都
没有问题,那个同胞在这没有过多经验,他不理解对于bagging为什么要用bootstrap,
两个方法不能同时用,说我说错了,我解释bagging又称bootstrap aggregation,
bootstrap用来增加sample size,重新解释了一下。他还不理解,我真是要跪了,另外
一个VP和另外一人保持沉默。面试后,我写信向VP和同胞解释,查note和书,说我的理
解没有问题,没有任何反馈。今天收到HR的信,说我没有enough background in
statistical methodologies。 真遇到不会的问题挂了就认了,这种倒霉的事情就让我
遇上了。那个同胞说话口气很冲,好像就是问倒我。都是中国人,你说何苦这样哪。。。
当然,关于boosting的概念回答完后,我说... 阅读全帖
c***z
发帖数: 6348
48
来自主题: DataSciences版 - [Data Science Project] Location data quality
阶段性总结
Overall this task can be conducted iteratively between two steps: the
training step using clustering of labeled samples and the bootstrapping step
adding unlabeled samples to increase coverage. Currently we can consider
the first iteration of the training step complete and move on the the
bootstrapping step.
1. 2000+ good and 2000+ bad partners provided;
2. I conducted hierarchical clustering analysis with seven metrics on a set
of good and bad samples, luckily the clusters are highly corr... 阅读全帖
c***z
发帖数: 6348
49
来自主题: DataSciences版 - [Data Science Project] Location data quality
阶段性总结
Overall this task can be conducted iteratively between two steps: the
training step using clustering of labeled samples and the bootstrapping step
adding unlabeled samples to increase coverage. Currently we can consider
the first iteration of the training step complete and move on the the
bootstrapping step.
1. 2000+ good and 2000+ bad partners provided;
2. I conducted hierarchical clustering analysis with seven metrics on a set
of good and bad samples, luckily the clusters are highly corr... 阅读全帖
z****e
发帖数: 54598
50
来自主题: Military版 - 美国有一点做得非常好!
来来来,卡亚可桑,这是大师的挑战贴,麻烦你点评一下
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 如果你不是孬种数学背景出来搞统计的,请接受挑战
发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱,我想请seattleren, ningyan, kaleege,marole(haha),NYHuan(无敌小
欢)以及Jasonlin (legendary)等人接受我的挑战。当然,这份被邀请者名单是开放的,
我将根据版上的动态随时更新。我也欢迎任何人参与严肃的讨论。不能说出个一二三四
的,就请自动回避,免得自讨没趣(我想对pp65说的是,我对你感到抱歉,因为本段最
后的话对... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)