由买买提看人间百态

topics

全部话题 - 话题: efron
首页 上页 1 2 3 4 5 6 7 下页 末页 (共7页)
d***d
发帖数: 99
1
我们觉得我们这么多专业的样本数,足够收敛你sb的概率到1了,而且还是强收敛。 这
个例子希望能帮助你理解。
h***s
发帖数: 1716
2
sb 是不是这样定义的: Statistically Biased to sb
T*******I
发帖数: 5138
3
谢谢你的解惑。我想请问的是,是否有人提出过我在这里提出的那个问题,如果有人提
出过,人们是如何解答的?最后,提醒你一下,谩骂式的语言不会为你的论证提供丝毫
的帮助。
h***s
发帖数: 1716
4
不客气. 我用的是一个比喻和玩笑, 事实是良药苦口.
如果您感到被谩骂和冒犯的话, 我道歉! 希望您灌水开心就好.
a******n
发帖数: 11246
5
收敛到常数的话,各种收敛都是一回事 。 哈哈
k********g
发帖数: 56
6
围观一年了,插一句嘴。
大师您数学不行这已经是公认的了,我也不逼你写个证明。
George E. P. Box有句名言,
all models are essentially wrong, but some are useful.
bootstrap在asymptotics的角度上是正确的,但你不懂。
ok,现在我们假设你批评的对,假设它的理论基础是错误的(请注意,仅仅是假设)。
但问题是在很多很广泛的情况下,这个方法很有用。
所以,如果没有人能够提出一个更“好”的方法,并在实践中在真实数据和数值模拟中
证明这种新方法在更多更广泛的情况下都很有用。那对bootstrap的质疑是没有意义的。
你要是有新方法,也要在真实数据和数值模拟中得到好的结果才行,光是哲学描述没意
义。
T*******I
发帖数: 5138
7
那就请你将整个概率论的理论基础改写以便为你的bootstrap法提供一个理论基础。
Bootstrap法看起来有意义是因为你在按照一个前提假设设计一套算法流程或技术,因
而所有结果都是满足你的假设的。然而,如果那个前提假设(也即理论基础)不正确,
你的整个技术流程将被颠覆和抛弃。这就是理论的新突破必然导致旧技术的死亡。这是
所有科学领域的一个普遍且必然的现象,更何况作为一般科学方法论的统计学。
任何一个统计方法在其数学算法形成前都有一个缜密的分析逻辑,这个分析逻辑指导着
整个方法论的建立以及数学技术的使用。如果分析逻辑发生错误,那么方法论必然错误。
因此,在统计学里藐视哲学的逻辑分析将必然导致悲剧。
说到Box的那句名言,我认为它可能是一句错误的名言,正如大名人马可.吐温说的:
“谎言,大谎言,真实的大谎言,统计数字。”也是一句经典的错误名言一样。
T*******I
发帖数: 5138
8
是的,我用哲学式的阐述给出了你需要的关于那个命题的逆命题的论证。你要是不满意
,或是发现我的论证存在不严谨之处,或者嫌我的语言繁琐,你不妨将它翻译成你熟悉
的数学语言,并且还可以改进一下论证的陈述。然后你就可以骄傲地向世人宣布你在数
学上取得的成功。
T*******I
发帖数: 5138
9
这个定义可能是一个sh给它自己定义的。
d***d
发帖数: 99
10
我老一开始就贴了这个,可惜需要你点破陈大师阿,sigh,我还以为陈大师悟性这么高
会自己figure out.

的。
A*******s
发帖数: 3942
11
我同桌名字叫光,我跑得比他快
A*******s
发帖数: 3942
12
你不懂数学术语就别乱用...乱用的后果就是没人知道你想问啥
你问的问题就相当于--自然数和立方体的内积在希尔伯特空间的秩是多少?
不要以为懂得一两个数学术语就以为自己不是脑残了...
T*******I
发帖数: 5138
13
那个问题中涉及的基本概念极其简单。A是一个随机变量,B也是,各有自己的概率空间
和分布特征,我问的就是它们的分布特征是否一致。这等同于我把一只猫和一只老虎扔
在你面前,你给我说说它们是否一样?
A*******s
发帖数: 3942
14
我真是闲得没事干...
你给我说说
你说的A, B只得是哪两个随机变量?
各有自己的概率空间是啥意思?
分布特征是什么咚咚?
你仍了两坨大便
说一个是猫一个是虎
w******e
发帖数: 1621
15
往死里顶
T*******I
发帖数: 5138
16
ok,你的这个回答只能将我们之间的讨论导向统计学的起始阶段的几个最原始的概念(
总体,样本,代表性,测量或测度、概率化、样本估计等),所以,可否请你重新浏览
第8,31和45楼,看看我所提出的问题?
d******e
发帖数: 7844
17
样本的empirical distribution当然不是true distribution。
可惜你不明白Glivenko–Cantelli定理,唉。
T*******I
发帖数: 5138
18
遗憾的是,统计只能处理经验样本或经验事实,它处理不了总体(及试图知道的“理论
”事实),任何概率空间能且只能被定义在样本提供的经验空间里,因为只有样本才能
作为总体的一个代表性分布(只是,我们永远不可能知道这个代表性的好坏程度究竟怎
样)。如果说统计学里有什么定理,这个就是它的第一定理。
d***d
发帖数: 99
19
mb这Y是老邢找来增加流量的吧?
d******e
发帖数: 7844
20
Glivenko–Cantelli可以看成是中心极限定理的推广,不过大师应该也不明白中心极限
订立成立。
但是大师要知道,你天天在那里嚷嚷说t-test NB,这玩意也是建立在中心极限极限之
上的。
如果没有中心极限定理做收敛性的保障,t-test就是坨屎了。
统计工具之所以有效,大样本收敛性分析是理论保障之一,连sample mean这种最简单
的计算也是有大数率来保障的。
可惜大师只会脑补,什么都已一拍脑门YY,就“想”出来了。
T*******I
发帖数: 5138
21
中心极限定理对于搞统计的人来说应该是一个常识了。但我们在这里讨论的是一个从总体中来的随机样本与一个基于此随机样本上的bootstrapping过程得到的统计量分布对总体的同质参数的代表性问题。你得首先搞清楚这两个随机样本中究竟谁是对总体的一个恰当的代表?谁是从总体中来的,谁不是?你那个bootstrapped的分布才真正是拍脑门拍出来的。
g********r
发帖数: 8017
22
蛋腚。大师不可说服乃是公理。
k********g
发帖数: 56
23
你提出一个比bootstrap好的方法,然后用它分析一个数据,写出数据分析结果,再分
析为什么这些结果能说明你的方法比bootstrap好,如果说得通,你就赢了。不对,只
要你敢写出数据分析的结果,你就赢了。
我最后强调一遍,我引用box的话意思是说,我们现在假设bootstrap理论上就是一坨屎
,理论基础完全不成立,它有罪,就该死。假设你的批评全都对。
但它在数据分析实践中很方便,很有用,得到了对其他学科有用的被实践证实的结果,
但凭这一点,bootstrap就有功,在没有更好的方法之前不可被取代。
就好比你坐飞机,在飞行中你发现飞行员尽管很有经验,但你就觉得他很烂。在你能找
到其他更好的飞行员替代他之前,你不能把他从飞行员的位置上推下来打死,除非你想
马上去见你的上帝。

误。
k********g
发帖数: 56
24
我们应该感谢陈大师帮助统计版提升人气。
r*****y
发帖数: 199
25
我觉得你对大师真是仁至义尽了,但是他是个偏执狂,无可救药了。
G********t
发帖数: 334
26
不该
T*******I
发帖数: 5138
27
其实,Bootstrap使用起来不是很方便,有很大的主观人为性,而且存在着这样的一个问题:
我们可以将从原始样本中反复抽取的样本合并为一个单一的样本吗?答案显而易见是肯定的,因为此时的原始样本成了你的抽样“总体”,由于抽样是replable,如果你设定抽样次数为5000次,那么,原始样本中的每一个独立个体都将有5000次机会被抽到。如果合并这5000个bootstrapped的样本,你可以预见到这个合并结果会是怎样的情形,也就是把原始样本的
sample size扩大了5000倍。这是否有点crazy?
反之,如果你认为那5000个bootstrapped的样本不可合并,那你就是在颠覆整个统计学的最
核心的概念基础。
今年7月在JSM会议上我与一位华人PhD统计学家谈到过我对最优化、强制连续性以及Bootstrap法等的批判性观点,他大为吃惊地说:我们从来没有像你这样思考过问题,也从未怀疑过这里会有什么问题!我想,在此发言的各位也许与他类似。你们缺乏怀疑和批判的精神。
r*****y
发帖数: 199
28
我想大家都赞赏怀疑和批判的精神,但是你这样的怀疑和批判有个屁用,你要真有这股
劲,不如现在开始好好自学概率论,用学术界能够接受的语言和论述来提出并证明你的
观点,theoretical proof或者simulation results,而不是整天在这里唧唧歪歪,然
后拿屁点价值也没有的JSM paper在这里扯淡。
A*******s
发帖数: 3942
29
你不懂后面的理论也就算了,
boostrapping怎么用你都不知道.
还以为自己在创新在革命在怀疑在批判思考呢...
大师,你的所谓统计理论是自己空想出来的
你批判的统计理论也从来不存在

个问题:
肯定的,因为此时的原始样本成了你的抽样“总体”,由于抽样是replable,如果你设
定抽样次数为5000次,那么,原始样本中的每一个独立个体都将有5000次机会被抽到。
如果合并这5000个bootstrapped的样本,你可以预见到这个合并结果会是怎样的情形,
也就是把原始样本的
学的最
Bootstrap法等的批判性观点,他大为吃惊地说:我们从来没有像你这样思考过问题,
也从未怀疑过这里会有什么问题!我想,在此发言的各位也许与他类似。你们缺乏怀疑
和批判的精神。
T*******I
发帖数: 5138
30
本次讨论中我的思路一路走过来,请回阅以下几楼:
8, 31, 45, 60, 69, 72, 77, 83
如果你还要什么theoretical proof,你自己构造一个出来吧。
一个统计方法的好坏以及正确和错误,不需要什么数学证明,而是要阐述清楚其中的每
一要素的性质是什么,相互之间的关系是否存在逻辑基础。这就是最强大的理论证明。
如果一个人对一个方法论中的每一要素的基本性质及其相互间的关系都无法自圆其说,
那个方法是不可信的。至于Simulation,基本上都是在假设条件下做的,在我看来没有
多大的意义。
统计学处理的是来自未知总体的经验事实,是为了以此为基础实现对未知总体的一个认
识。由于样本是我们所拥有的关于总体的全部信息,因此,针对总体的全部认识能且
只能建立在对样本信息的抽象归纳的基础之上,而不是任何其它什么来源的“信息”。
这是统计学的第一条铁律。
T*******I
发帖数: 5138
31
你的这个回答是不诚实的。
你的手中只有一个来自总体的原始样本,你为什么要对这个原始样本反复抽样?你想得
到什么呢?例如,如果你认为原始样本取样不好,偏离了自己的预期,于是你就搞
bootstrap,试图用这个方法来弥补与你的预期之间的误差。由于你缺乏针对总体的进一
步操作,就只好引入你的假设,以便使得bootstrap的结果朝向你的预期。这个认知过
程会带给人们什么结果?你知道,我也知道。
算了,关于Bootstrap的讨论就此打住。我也许需要重新思考一些问题。
h***s
发帖数: 1716
32
猫和老虎是一样的. 你怎么看?
h***s
发帖数: 1716
33
不行. 您这么就不讨论了, 肯定是害怕了, 觉得自己没道理, 理亏了. 想逃跑了.

进一
T*******I
发帖数: 5138
34
猫和老虎是不一样的。不然的话,它们应该同名而非异名。一只猫来自猫群而非虎群;
同理,一只老虎来自虎群而非猫群。
如果你想说猫和老虎是一样的,那是因为它们都属于猫科,所以,你可以说一只猫来自猫科,一只老虎也来自猫科,而一头狮子或豹子也来自猫科。
T*******I
发帖数: 5138
35
我不想知道你的名字,但想知道你来自中国的什么地方。可以诚实地告知吗?当然,你
也可以继续你的捉弄人的心理游戏。但是,如果你确实是诚实地告诉了大家你是哪里出
生长大的,我就会诚实地告诉你sh是什么意思。
q*****q
发帖数: 158
36
大师应该为你的真理为你伟大的颠覆性的统计学新的地平线执著到底,何况区区200刀
呢?我觉得大师真不应该到mitbbs这种小的学科论坛上对牛弹琴,而是应该参加各种统
计学的大大小小的会议,推销您伟大的理论。
大家都不要劝大师了,你们跟大师这样的伟人根本不是一个级别的。要不然你们能听不
懂大师的理论?大师学贯中西,天赋异禀,阐述事情可以自己不懂但是不会让别人不懂
的,大家都检讨自己的问题吧。
再说了,人家大师可是政府单位的高级统计学家,你们如果是大师,谁能找到这种好工
作,没事还给发意外的奖金?哎呀,大师,我挺你!
T*******I
发帖数: 5138
37
你错了。我不需要人挺。
A*******s
发帖数: 3942
38
"如果你设定抽样次数为5000次,那么,原始样本中的每一个独立个体都将有5000次机
会被抽到。如果合并这5000个bootstrapped的样本,你可以预见到这个合并结果会是怎
样的情形,也就是把原始样本的sample size扩大了5000倍。这是否有点crazy?"
这是你说的吧?找本书看看boostrapping到底是怎么做的再来批判吧?

进一
q*****q
发帖数: 158
39
大师说的是,虔诚接受大师的批评教育!大师不需要人挺,但是我还是继续崇拜大师!
T*******I
发帖数: 5138
40
我知道。你没看我的全文。现行的Bootstrap不会将那5000个bootstrap的样本合并为一
,而是分别对每个样本计算目标统计量。
我之所以那样说是由于根据所有bootstrapped样本的“总体=原始样本”的来源的一致
性、可放回式抽样的完全随机性以及集合的可加性它们可以合并为一个单一的大样本。
w*******a
发帖数: 2409
41
真是浅池王八多。俺不懂大师的一套理论,但是对bootstrap有异议的不止大师一个吧
,俺就见到听到不少颇有实力的叫兽质疑过。精算算也就是个半路出家的水平,显摆指
点甚江山,这个版上够当你师爷的中国人且多了去了
h***s
发帖数: 1716
42
我还是认为猫和老虎是一样的!!! 不然的话,你妈妈,你母亲,还有你娘岂不是多
个人的代称?同理,一只老虎即来自虎群,也来自猫群。

自猫科,一只老虎也来自猫科,而一头狮子或豹子也来自猫科。
w*******a
发帖数: 2409
43
真是浅池王八多。俺不懂大师的一套理论,但是对bootstrap有异议的不止大师一个吧
,俺就见到听到不少颇有实力的叫兽质疑过。精算算也就是个半路出家的水平,显摆指
点甚江山,这个版上够当你师爷的中国人且多了去了
A*******s
发帖数: 3942
44
我咋支点江山了?大师自认为的boostrapping根本旧部是我见过的boostrapping,你连
这个都有异议?
我当然知道自己几斤几两,你不照镜子估计不知到自己是王八吧
T*******I
发帖数: 5138
45
你既然只有如此认知能力,我认为你没有资格在统计里面混饭吃。
w*******a
发帖数: 2409
46

爷可没上来用半吊子统计知识去教育别人什么是bootstrap。你刚才对大师bootstrap的
评论恰恰显示了你的水平。除了bootstrap您不也常对别的东西品评论足么?都不明白
这些二把刀都显摆啥,早晚给炖乌鸡了。。。
A*******s
发帖数: 3942
47
来,大师的徒弟说说我哪地方说错了?我倒要看看大师的粉丝除了装逼装成sb之外还能
干啥?
T*******I
发帖数: 5138
48
还是我来评论一下吧。你在第95楼对我在第83楼所提的问题的评论是不恰当的。
A*******s
发帖数: 3942
49
多口问一句,那ID是你老婆么?
w*******a
发帖数: 2409
50
看看自己指点的江山
爷不是大师的粉丝,你也就傻逼傻逼的叫着去吧。
爷似乎明白为啥那么多牛的中国人不来发表意见,偏偏您这种二刀贩子来指点了。您继
续挥斥方遒吧
"如果你设定抽样次数为5000次,那么,原始样本中的每一个独立个体都将有5000次机
会被抽到。如果合并这5000个bootstrapped的样本,你可以预见到这个合并结果会是怎
样的情形,也就是把原始样本的sample size扩大了5000倍。这是否有点crazy?"
这是你说的吧?找本书看看boostrapping到底是怎么做的再来批判吧?

进一
首页 上页 1 2 3 4 5 6 7 下页 末页 (共7页)