由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 对goldmember的数据的三分回归分析结果
相关主题
陈大师的连续性说两句关于bootstrap的看法
陈大师的意思我终于有点领会了大小样本比较
Dr. Efron要来DC讲座了,我该去听吗?请教bootstrap的问题
请问:bootstrap的应用范围请教大神们关于bootstrap
如果你不是孬种数学背景的统计学家,请接受挑战用什么样的统计方法合适!
R memory urgent helpmulticollinearity和 predicion model
陈大师, 我很好奇standard deviation v.s. standard error
bootstrap真的能让让我们逼近“真理”吗有个bootstrap的问题想找人讨论下。
相关话题的讨论汇总
话题: 临界点话题: 样本话题: 模型话题: 随机话题: 全域
进入Statistics版参与讨论
1 (共1页)
T*******I
发帖数: 5138
1
我对goldmember在其“陈大师,民科与否,在此一战”中的数据进行了三分回归分析,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70)相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更好的全域模型来描述该样本数据,估计的结果就会更精准,但绝对不会恰好等于“样本基础上的”最佳临界点。
在本分析的方法学中,两个临界点具有实际的决策意义。
以下是用简单线性模型拟合的三分回归模型组:
The SAS System
22:15 Wednesday, June 1, 2011 1
Segment=1:Low
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 1.65778 1.33054 1.25 0.2180
X 1 1.09544 0.07704 14.22 <.0001
Segment=2:Middle
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 69.75268 3.30788 21.09 <.0001
X 1 -1.00816 0.06385 -15.79 <.0001
Segment=3:High
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 -9.30601 5.74290 -1.62 0.1112
X 1 0.19096 0.06807 2.81 0.0071
Continuity Test
Between the Low and Middle:
连接变异(Difference)= 5.87
连续性检验的概率 P = 0.0516 (Non-continuous)
Between the Middle and High:
连接变异(Difference)= 1.81
连续性检验的概率 P = 0.0159 (Continuous)
这里我没有计算两个临界点的可信区间。按照我的文章所提供的思路,它们的可信区间可以轻而易举地得到,而无需通过一个bootstrapping过程,因为每个临界点都存在着200个随机实测点和200个相应的权重。
原始数据参见:
http://www.mitbbs.com/article_t/Statistics/31282723.html
A*******s
发帖数: 3942
2
搞了这么久,说了这么多,就搞出来一个linear和一个polynomial?

,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分
割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近
样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70
)相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计
得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更
好的全域模型来描述该样本数据,估计的结果就会更: 精准。
间可以轻而易举地得到,而无需通过一个bootstrapping过程,因为每个临界点都存在
着200个随机实测点和200个相应的权重。

【在 T*******I 的大作中提到】
: 我对goldmember在其“陈大师,民科与否,在此一战”中的数据进行了三分回归分析,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70)相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更好的全域模型来描述该样本数据,估计的结果就会更精准,但绝对不会恰好等于“样本基础上的”最佳临界点。
: 在本分析的方法学中,两个临界点具有实际的决策意义。
: 以下是用简单线性模型拟合的三分回归模型组:
: The SAS System
: 22:15 Wednesday, June 1, 2011 1
: Segment=1:Low
: Parameter Estimates
: Parameter Standard
: Variable DF Estimate Error t Value Pr > |t|
: Intercept 1 1.65778 1.33054 1.25 0.2180

D**g
发帖数: 739
3
您老光管fit出个curve,model diagnosis 管不管?

,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分
割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近
样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70
)相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计
得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更
好的全域模型来描述该样本数据,估计的结果就会更: 精准。
间可以轻而易举地得到,而无需通过一个bootstrapping过程,因为每个临界点都存在
着200个随机实测点和200个相应的权重。

【在 T*******I 的大作中提到】
: 我对goldmember在其“陈大师,民科与否,在此一战”中的数据进行了三分回归分析,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70)相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更好的全域模型来描述该样本数据,估计的结果就会更精准,但绝对不会恰好等于“样本基础上的”最佳临界点。
: 在本分析的方法学中,两个临界点具有实际的决策意义。
: 以下是用简单线性模型拟合的三分回归模型组:
: The SAS System
: 22:15 Wednesday, June 1, 2011 1
: Segment=1:Low
: Parameter Estimates
: Parameter Standard
: Variable DF Estimate Error t Value Pr > |t|
: Intercept 1 1.65778 1.33054 1.25 0.2180

T*******I
发帖数: 5138
4
本三分回归分析的首要目的是要找到两个可期望的临界点,三分模型结果还没给出来。不过,在两个点被找到后,后续的一切分析简单得易如反掌。

【在 A*******s 的大作中提到】
: 搞了这么久,说了这么多,就搞出来一个linear和一个polynomial?
:
: ,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分
: 割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近
: 样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70
: )相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计
: 得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更
: 好的全域模型来描述该样本数据,估计的结果就会更: 精准。
: 间可以轻而易举地得到,而无需通过一个bootstrapping过程,因为每个临界点都存在
: 着200个随机实测点和200个相应的权重。

T*******I
发帖数: 5138
5
那个curve并非我们所要全部结果,它仅仅被用来作为一个测量工具来估计两个临界点
。我们真正要的结果是在两个临界点基础上的三分模型以及模型间的差异显著性和各相
邻模型间的连续性。

【在 D**g 的大作中提到】
: 您老光管fit出个curve,model diagnosis 管不管?
:
: ,结果如下两图所示。第一种分割使用的fullwise model是简单的线性回归;第二种分
: 割使用的则是三次多项式模型。可见,全域模型越准确,对两个临界点的估计也越接近
: 样本真实。但我们需要记住的是,不可能得到一个与样本所示的临界点(大约是40,70
: )相等的临界点,因为样本仅仅是总体的一个随机子集。把一个样本的实际临界点估计
: 得精准无误可能就意味着overfitting。当然,如果我们能够找到一个比三次多项式更
: 好的全域模型来描述该样本数据,估计的结果就会更: 精准。
: 间可以轻而易举地得到,而无需通过一个bootstrapping过程,因为每个临界点都存在
: 着200个随机实测点和200个相应的权重。

s**f
发帖数: 365
6
Joint point?
http://surveillance.cancer.gov/joinpoint/

【在 T*******I 的大作中提到】
: 那个curve并非我们所要全部结果,它仅仅被用来作为一个测量工具来估计两个临界点
: 。我们真正要的结果是在两个临界点基础上的三分模型以及模型间的差异显著性和各相
: 邻模型间的连续性。

T*******I
发帖数: 5138
7
见修改后的附图。

【在 s**f 的大作中提到】
: Joint point?
: http://surveillance.cancer.gov/joinpoint/

g********r
发帖数: 8017
8
老陈回来了。还有结果。精神可嘉。
可惜你这个fit法,就算数据里没有任何噪音,也不能还原真实断点的位置。
这个数据的underlying model, 真实断点就在40。
噪音也够小,眼睛都能分辨。
用这种多项式的办法偏差够大的。
T*******I
发帖数: 5138
9
你的思维已经完全背离了统计学的基本逻辑。我们是绝对不可能知道总体中的临界点的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你要是不信,做100次随机模拟试验后再来评估。
再说,你的所谓肉眼观察的结果是在二维空间下的直观结果,如果是在多维甚至高维下,你怎么直观呢?

【在 g********r 的大作中提到】
: 老陈回来了。还有结果。精神可嘉。
: 可惜你这个fit法,就算数据里没有任何噪音,也不能还原真实断点的位置。
: 这个数据的underlying model, 真实断点就在40。
: 噪音也够小,眼睛都能分辨。
: 用这种多项式的办法偏差够大的。

d******e
发帖数: 7844
10
唉,说到底大使还是不知道sample和population的区别,因为大师不知道什么随机变量

的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你
要是不信,做100次随机模拟试验后再来评估。
下,你则么直观呢?

【在 T*******I 的大作中提到】
: 你的思维已经完全背离了统计学的基本逻辑。我们是绝对不可能知道总体中的临界点的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你要是不信,做100次随机模拟试验后再来评估。
: 再说,你的所谓肉眼观察的结果是在二维空间下的直观结果,如果是在多维甚至高维下,你怎么直观呢?

相关主题
R memory urgent help说两句关于bootstrap的看法
陈大师, 我很好奇大小样本比较
bootstrap真的能让让我们逼近“真理”吗请教bootstrap的问题
进入Statistics版参与讨论
n*****n
发帖数: 3123
11
你们跟一个统计白痴谈什么统计啊。真是闲的没事干了
T*******I
发帖数: 5138
12
你岂止是个白痴。如果你不是,请回答我整个空间上的关系是否是连续的?你的统计证
据何在?

【在 n*****n 的大作中提到】
: 你们跟一个统计白痴谈什么统计啊。真是闲的没事干了
A*******s
发帖数: 3942
13
又糊涂了,啥叫“可以期望”? expectable?

的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你
要是不信,做100次随机模拟试验后再来评估。
下,你怎么直观呢?

【在 T*******I 的大作中提到】
: 你的思维已经完全背离了统计学的基本逻辑。我们是绝对不可能知道总体中的临界点的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你要是不信,做100次随机模拟试验后再来评估。
: 再说,你的所谓肉眼观察的结果是在二维空间下的直观结果,如果是在多维甚至高维下,你怎么直观呢?

n*****n
发帖数: 3123
14
该干嘛干嘛。别在这儿丢人了. 你连基本的统计概念都没有。

【在 T*******I 的大作中提到】
: 你岂止是个白痴。如果你不是,请回答我整个空间上的关系是否是连续的?你的统计证
: 据何在?

n*****n
发帖数: 3123
15
记着吃药

【在 T*******I 的大作中提到】
: 你岂止是个白痴。如果你不是,请回答我整个空间上的关系是否是连续的?你的统计证
: 据何在?

T*******I
发帖数: 5138
16
如果你有统计学的基本概念,那好,回答我的问题并提供你的证据。否则你就是在胡说
八道。

【在 n*****n 的大作中提到】
: 该干嘛干嘛。别在这儿丢人了. 你连基本的统计概念都没有。
T*******I
发帖数: 5138
17
你该做我的小学生了。

【在 n*****n 的大作中提到】
: 记着吃药
g********r
发帖数: 8017
18
模拟数据里,总体的临界点是已知的。

的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你
要是不信,做100次随机模拟试验后再来评估。
下,你怎么直观呢?

【在 T*******I 的大作中提到】
: 你的思维已经完全背离了统计学的基本逻辑。我们是绝对不可能知道总体中的临界点的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你要是不信,做100次随机模拟试验后再来评估。
: 再说,你的所谓肉眼观察的结果是在二维空间下的直观结果,如果是在多维甚至高维下,你怎么直观呢?

T*******I
发帖数: 5138
19
但是,你只给了我唯一的样本,而我既不知道总体的临界点在哪里,也不可能按照肉眼
直观确定临界点。此外,我也不知道整个空间上的过程是否是一个连续的过程。我只能
用一种办法来搜索并作出估计和推断。
我也说了,整个估计过程及其结果依然可以被改进,包括引入一个更好的全域模型。但
每个临界点的估计不能以最优化和强制连续来实现,因为这个“最优化的对应”是一个
随机对应,是不可期望的,而抽样基础上的连续性也是不可知的,必须由概率作出判断。
我在这里演示的是在加权基础上的临界点估计和模型间的连续性检验。这是一个全新的
分析逻辑。没有人这样做过。如果你坚持要以最优化和强制连续来估计临界点,那么,
请阐述清楚你的理由和逻辑。

【在 g********r 的大作中提到】
: 模拟数据里,总体的临界点是已知的。
:
: 的,只能由样本进行估计,而一个样本的最佳断点绝对不是总体中可以期望的断点。你
: 要是不信,做100次随机模拟试验后再来评估。
: 下,你怎么直观呢?

g********r
发帖数: 8017
20
虽然只有一组数据,但是点很多,噪音很小。如果这都能fit出明显不合理的结果,那
方法就有问题了。
这就像给你一个线性关系的样本,明明肉眼都看出斜率是正的,你的方法楞给拟合出负
的来。你能用样本偏差来解释么?只能说方法不灵。

断。

【在 T*******I 的大作中提到】
: 但是,你只给了我唯一的样本,而我既不知道总体的临界点在哪里,也不可能按照肉眼
: 直观确定临界点。此外,我也不知道整个空间上的过程是否是一个连续的过程。我只能
: 用一种办法来搜索并作出估计和推断。
: 我也说了,整个估计过程及其结果依然可以被改进,包括引入一个更好的全域模型。但
: 每个临界点的估计不能以最优化和强制连续来实现,因为这个“最优化的对应”是一个
: 随机对应,是不可期望的,而抽样基础上的连续性也是不可知的,必须由概率作出判断。
: 我在这里演示的是在加权基础上的临界点估计和模型间的连续性检验。这是一个全新的
: 分析逻辑。没有人这样做过。如果你坚持要以最优化和强制连续来估计临界点,那么,
: 请阐述清楚你的理由和逻辑。

相关主题
请教大神们关于bootstrapstandard deviation v.s. standard error
用什么样的统计方法合适!有个bootstrap的问题想找人讨论下。
multicollinearity和 predicion model请教如果计算CI for the ratio of two independent means?
进入Statistics版参与讨论
T*******I
发帖数: 5138
21
我不认为是方法灵不灵的问题。我的分析结果对本例来说确实存在不精准的问题,但方法依然是灵敏的,导致结果发生偏差是由于其它因素造成的,即一个尽可能好的全域模型的定义。
从我所提供的两套分析结果来看,全域模型差则估计结果也差,反之则比较好。所以,改进本样本估计的方法不是要否定整个分析的基本逻辑和算法,而是要改进对本例全域模型的定义。但无论如何,最优化和强制连续性都是不可接受的,因为它们违反了随机性原则,而一旦一个或多个根本不存在的确定性假设被引入到一个统计学的方法论中,则该方法论就不应该被视为统计学方法。
此外,对一个方法的评判不能只看灵敏度,还要看其特异度,并且要考察其稳定性和适用性。本分析法除了全域模型的定义外没有任何其它确定性假设,而即便是全域模型的定义也是有着概率推断的支持的。
我会给出关于每个临界点的加权随机测量的200个随机点测量结果,其中的每个点都包含了原始样本中每个点对它的贡献。每个临界点正是在这些点及其权重的基础上被估计出来的。由此可知,对两个临界点的估计(在一定的技术条件下)应该是相当稳定和可靠的。
样本只是总体的一个表象,而非总体的真实。我们不能被表象所迷惑,否则就是太过经验主义和机械唯物主义。
最后,即使总体的临界点是40和70,你怎么能保证每次随机抽样时的临界点一定是40和70?所以,可否请你提供产生该数据的随机模拟程序?我想看看你的程序是如何设计的。我已提供了一个两分法的随机模拟试验的程序给你,希望你也能满足我的这个愿望。

【在 g********r 的大作中提到】
: 虽然只有一组数据,但是点很多,噪音很小。如果这都能fit出明显不合理的结果,那
: 方法就有问题了。
: 这就像给你一个线性关系的样本,明明肉眼都看出斜率是正的,你的方法楞给拟合出负
: 的来。你能用样本偏差来解释么?只能说方法不灵。
:
: 断。

d******e
发帖数: 7844
22
都说了你不懂overfitting了,可你偏偏不信邪。
你所谓的二分三分,乃至四分五分,每加入一段都会增加模型的复杂度。
只有一段的时候,你只有p个变量,两段时2p个,... ...随着模型复杂度的上升,你的
对样本的fit会越来越好,终于,当你选择的段数是n/2的时候,你可以达到对训练样本
的完美fit(任意两点确定一条支线)。
不指望你能看懂,spline的强制连续和平滑假设都不过是一种model的regularization
,大家通常都不认为这个假设是完全正确的,但因为这两个假设可以很少的控制模型的
复杂程度,所以在实际使用中通过控制bias variance trande off一样可以得到不错的
性能。
你所谓的这种不连续的分段线性模型,会随着variable数量上升,很快死掉。想想只有
几百个数据,而有上万个variable的时候,哪怕是普通的linear model fit都是
rediculous的。你这种分段fit,那就totlally wrong了。

方法依然是灵敏的,导致结果发生偏差是由于其它因素造成的,即一个尽可能好的全域
模型的定义。
,改进本样本估计的方法不是要否定整个分析的基本逻辑和算法,而是要改进对本例全
域模型的定义。但无论如何,最优化和强制连续性都是不可接受的,因为它们违反了随
机性原则,而一旦一个或多
适用性。本分析法除了全域模型的定义外没有任何其它确定性假设,而即便是全域模型
的定义也是有着概率推断的支持的。
包含了原始样本中每个点对它的贡献。每个临界点正是在这些点及其权重的基础上被估
计出来的。由此可知,对两个临界点的估计(在一定的技术条件下)应该是相当稳定和
可靠的。
经验主义和机械唯物主义。
已提供了一个两分法的随机模拟试验的程序给你,希望你也能满足我的这个愿望。

【在 T*******I 的大作中提到】
: 我不认为是方法灵不灵的问题。我的分析结果对本例来说确实存在不精准的问题,但方法依然是灵敏的,导致结果发生偏差是由于其它因素造成的,即一个尽可能好的全域模型的定义。
: 从我所提供的两套分析结果来看,全域模型差则估计结果也差,反之则比较好。所以,改进本样本估计的方法不是要否定整个分析的基本逻辑和算法,而是要改进对本例全域模型的定义。但无论如何,最优化和强制连续性都是不可接受的,因为它们违反了随机性原则,而一旦一个或多个根本不存在的确定性假设被引入到一个统计学的方法论中,则该方法论就不应该被视为统计学方法。
: 此外,对一个方法的评判不能只看灵敏度,还要看其特异度,并且要考察其稳定性和适用性。本分析法除了全域模型的定义外没有任何其它确定性假设,而即便是全域模型的定义也是有着概率推断的支持的。
: 我会给出关于每个临界点的加权随机测量的200个随机点测量结果,其中的每个点都包含了原始样本中每个点对它的贡献。每个临界点正是在这些点及其权重的基础上被估计出来的。由此可知,对两个临界点的估计(在一定的技术条件下)应该是相当稳定和可靠的。
: 样本只是总体的一个表象,而非总体的真实。我们不能被表象所迷惑,否则就是太过经验主义和机械唯物主义。
: 最后,即使总体的临界点是40和70,你怎么能保证每次随机抽样时的临界点一定是40和70?所以,可否请你提供产生该数据的随机模拟程序?我想看看你的程序是如何设计的。我已提供了一个两分法的随机模拟试验的程序给你,希望你也能满足我的这个愿望。

T*******I
发帖数: 5138
23
让我们就事论事。
从goldmember的数据来看,如果它是来自总体的一个随机样本,我们首先要弄明白我们
想要从中得到什么?在我看来就是两个变量间的关系及其在整个空间上的可变性的描述
,由此需要找到关系模型及其可能发生改变的临界点,从而找到根据关系改变进行决策
的依据。除此之外,我们还想要得到什么?
对于我们要认识的那个不可知的总体,该样本就是我们所能拥有的关于它的全部信息。
除此之外我们没有任何其它可资利用的信息。如果在方法论中事先给定一个连续性的假
设,这将是一个错误,因为总体并没有给予你这个确定性,因而你根本不可知,从而又
怎能事先假设它就是一个连续的过程?你需要做的是找到关系和临界点,并对连续性做
出概率推断。
尽管从数学的角度你可以假设一个样本可以被分成n/2甚至n段,但从统计学的角度,这
样的假设是荒谬可笑的,因而是根本不需要被考虑在内的。
在没有做出连续性检验之前,我是不知道我的分段模型是否是连续的。正如实例检验的
结果告诉我的那样,在低端临界点处,两个模型不连续是显著的,而在高端临界点处可
以认为在总体中的两段模型是连续的,尽管它们在样本中看起来是离断的。
在我看来,overfitting应该只在最优化方法论下才会发生。

你所谓的二分三分,乃至四分五分,每加入一段都会增加模型的复杂度。
只有一段的时候,你只有p个变量,两段时2p个,... ...随着模型复杂度的上升,你的
对样本的fit会越来越好,终于,当你选择的段数是n/2的时候,你可以达到对训练样本
的完美fit(任意两点确定一条支线)。
不指望你能看懂,spline的强制连续和平滑假设都不过是一种model的regularization
,大家通常都不认为这个假设是完全正确的,但因为这两个假设可以很少的控制模型的
复杂程度,所以在实际使用中通过控制bias variance trande off一样可以得到不错的
性能。
你所谓的这种不连续的分段线性模型,会随着variable数量上升,很快死掉。想想只有
几百个数据,而有上万个variable的时候,哪怕是普通的linear model fit都是
rediculous的。你这种分段fit,那就totlally wrong了。

【在 d******e 的大作中提到】
: 都说了你不懂overfitting了,可你偏偏不信邪。
: 你所谓的二分三分,乃至四分五分,每加入一段都会增加模型的复杂度。
: 只有一段的时候,你只有p个变量,两段时2p个,... ...随着模型复杂度的上升,你的
: 对样本的fit会越来越好,终于,当你选择的段数是n/2的时候,你可以达到对训练样本
: 的完美fit(任意两点确定一条支线)。
: 不指望你能看懂,spline的强制连续和平滑假设都不过是一种model的regularization
: ,大家通常都不认为这个假设是完全正确的,但因为这两个假设可以很少的控制模型的
: 复杂程度,所以在实际使用中通过控制bias variance trande off一样可以得到不错的
: 性能。
: 你所谓的这种不连续的分段线性模型,会随着variable数量上升,很快死掉。想想只有

g********r
发帖数: 8017
24
就事论事也是fit不行。这个topic不难做。做的人少是因为用途不广理论不新。弄个
gibbs sampler就能精确估计断点,置信区间想要的话也有,可是没有统计杂志会发表
它。
那个simulation我没存code。就那么几行嘛。选段点,断点见线性,加高斯噪音。

【在 T*******I 的大作中提到】
: 让我们就事论事。
: 从goldmember的数据来看,如果它是来自总体的一个随机样本,我们首先要弄明白我们
: 想要从中得到什么?在我看来就是两个变量间的关系及其在整个空间上的可变性的描述
: ,由此需要找到关系模型及其可能发生改变的临界点,从而找到根据关系改变进行决策
: 的依据。除此之外,我们还想要得到什么?
: 对于我们要认识的那个不可知的总体,该样本就是我们所能拥有的关于它的全部信息。
: 除此之外我们没有任何其它可资利用的信息。如果在方法论中事先给定一个连续性的假
: 设,这将是一个错误,因为总体并没有给予你这个确定性,因而你根本不可知,从而又
: 怎能事先假设它就是一个连续的过程?你需要做的是找到关系和临界点,并对连续性做
: 出概率推断。

T*******I
发帖数: 5138
25
希望goldmember用他/她的随机模拟程序再提供3到5个随机模拟样本。让我们看看是否
每一个随机模拟的样本的临界点都一定是40。

【在 g********r 的大作中提到】
: 老陈回来了。还有结果。精神可嘉。
: 可惜你这个fit法,就算数据里没有任何噪音,也不能还原真实断点的位置。
: 这个数据的underlying model, 真实断点就在40。
: 噪音也够小,眼睛都能分辨。
: 用这种多项式的办法偏差够大的。

g********r
发帖数: 8017
26
model generalization是研究生课程了。悠着点。

regularization

【在 d******e 的大作中提到】
: 都说了你不懂overfitting了,可你偏偏不信邪。
: 你所谓的二分三分,乃至四分五分,每加入一段都会增加模型的复杂度。
: 只有一段的时候,你只有p个变量,两段时2p个,... ...随着模型复杂度的上升,你的
: 对样本的fit会越来越好,终于,当你选择的段数是n/2的时候,你可以达到对训练样本
: 的完美fit(任意两点确定一条支线)。
: 不指望你能看懂,spline的强制连续和平滑假设都不过是一种model的regularization
: ,大家通常都不认为这个假设是完全正确的,但因为这两个假设可以很少的控制模型的
: 复杂程度,所以在实际使用中通过控制bias variance trande off一样可以得到不错的
: 性能。
: 你所谓的这种不连续的分段线性模型,会随着variable数量上升,很快死掉。想想只有

g********r
发帖数: 8017
27
我这个断点间的gap比噪音SD的三倍都大。就是为了给个容易的数据。生成多少次也是
特别明显的断点眼睛都能看出来。你自己模拟几个,你自己知道断点位置,看看你的方
法能不能还原出来。

【在 T*******I 的大作中提到】
: 希望goldmember用他/她的随机模拟程序再提供3到5个随机模拟样本。让我们看看是否
: 每一个随机模拟的样本的临界点都一定是40。

T*******I
发帖数: 5138
28
可以毫不夸张地说,抽掉了强制连续性假设,现代的spline理论和方法就彻底坍塌了。
令人遗憾的是,样本空间里的连续性并没有得到总体空间里的确定性的保障!
关于连续性,除了离断情形,还有可能是重叠。这是连续性假设更难对付的。

【在 g********r 的大作中提到】
: 就事论事也是fit不行。这个topic不难做。做的人少是因为用途不广理论不新。弄个
: gibbs sampler就能精确估计断点,置信区间想要的话也有,可是没有统计杂志会发表
: 它。
: 那个simulation我没存code。就那么几行嘛。选段点,断点见线性,加高斯噪音。

T*******I
发帖数: 5138
29
我已经给了一个500次随机模拟试验的SAS程序,结果还原得极其稳定和精准。当然,三
分情形下我没有做。不过,如果你不能以同样的模拟条件提供多个随机模拟样本,那么
,我只能给出上述结果。当然,如果我有更高级的数学技能,我或许可以找到一个更好
的全域模型,从而估计的结果就会更准确。
不论怎样,希望你能将模拟code回忆起来,让我运行几次,并看看是否每次的临界点都
是40和70。

【在 g********r 的大作中提到】
: 我这个断点间的gap比噪音SD的三倍都大。就是为了给个容易的数据。生成多少次也是
: 特别明显的断点眼睛都能看出来。你自己模拟几个,你自己知道断点位置,看看你的方
: 法能不能还原出来。

g********r
发帖数: 8017
30
不用我回忆。你以40和75为分界,分段做个回归就把设置找出来了。第三段是平的。

【在 T*******I 的大作中提到】
: 我已经给了一个500次随机模拟试验的SAS程序,结果还原得极其稳定和精准。当然,三
: 分情形下我没有做。不过,如果你不能以同样的模拟条件提供多个随机模拟样本,那么
: ,我只能给出上述结果。当然,如果我有更高级的数学技能,我或许可以找到一个更好
: 的全域模型,从而估计的结果就会更准确。
: 不论怎样,希望你能将模拟code回忆起来,让我运行几次,并看看是否每次的临界点都
: 是40和70。

1 (共1页)
进入Statistics版参与讨论
相关主题
有个bootstrap的问题想找人讨论下。如果你不是孬种数学背景的统计学家,请接受挑战
请教如果计算CI for the ratio of two independent means?R memory urgent help
[合集] 有个bootstrap的问题想找人讨论下。陈大师, 我很好奇
请大牛推荐cross validation 方面的好Book/Paperbootstrap真的能让让我们逼近“真理”吗
陈大师的连续性说两句关于bootstrap的看法
陈大师的意思我终于有点领会了大小样本比较
Dr. Efron要来DC讲座了,我该去听吗?请教bootstrap的问题
请问:bootstrap的应用范围请教大神们关于bootstrap
相关话题的讨论汇总
话题: 临界点话题: 样本话题: 模型话题: 随机话题: 全域