两分法随机模拟试验SAS Code (Part I) - Statistics版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 两分法随机模拟试验SAS Code (Part I)

相关主题
● 请问一道joint hypothesized test 的题目	● deviance residual
● can someone please translate this into english for me?	● 2 sample t-test with bootstrap 怎么搞？
● Residual and Partial Correlation	● two-way anova 的F-value 的意义。
● How to read in binary data in SAS	● regression后的residual是个双峰分布
● ask help for a paper on MI by Lu kaifeng 2010	● residual～predict plot出现这个样子，说明了什么？
● 怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)	● R lm一问
● normality test mix model	● A question about regression
● 问一个用simulation的问题	● Question Proc GENMOD

相关话题的讨论汇总
话题: fm话题: nn话题: data话题: seed话题: pe

进入Statistics版参与讨论

(共1页)

T*******I
发帖数: 5138

我准备接受goldmember的挑战公布Code。
SAS Code (Part I): Simulation for a Dichotomic Regression wirh Julious's Sample
我要公布的code仅仅是一个关于dichotomic regression simulation的SAS code。是我在4年多前写的。仅仅作了一点小小的更改。我的code写得很笨拙，但it runs good。请大家保存好你的500个随机样本。以备后用。
我将分段公布，这里是第一部分，data generation and random check.
这个例子是想要告诉大家，如果你的分析逻辑正确，根本不需要simulation。
正如我对goldmember说过，在接受这个挑战前，让我问大家几个问题：
如果总体中存在一个临界点，你认为样本临界模型一定在临界点处连续吗？如果你的回答是肯定的，你的哲学的或/和数学和/或统计学的逻辑基础是什么？然后再问问你自己，总体给了你连续性的保证吗？你可以在样本基础上假设总体的连续性吗？为什么？
大家回答了我的这几个问题后我再公布后面的正式算法部分。
以下是模拟方法说明：
在分段回归的问题上只算一个随机样本是远远不够的。我们需要在随机模拟的条件下验证它。所谓随机模拟，就是假如我们用任意一种方法算出一个样本的临界点后，将该样本分为两
段，计算出每一段的X的均数和标准差，并拟合出两段线性模型，然后用这些已知条件，即以上述临界点和分段模型为真实值，重新模拟样本，模拟时每段设定一致的样本量。假如由此生成500个随机样本，每个样本中第一段n1=15, 第二段n2=20。需要注意的是，需要适当扩大由每段样本计算的SD，这样，模拟时才能生成两段相互叠加的模拟样本，否则总是相互分离的。
模拟样本生成后，再用大家熟悉的各种方法对每一个模拟样本进行分段分析。我们需要知道的是，各种方法是否在其程序中设定了条件，如果有，就必须去除这些设定，因为它们是人为设定的确定性准则，而随机系统是不可能按照这些人为的准则运作的。我的方法无任何条件设定。
如果说大家以前对我反复提出过CV的问题，那么，这个随机模拟试验可以看成是对每种方法的一个CV。我绝对自信我的方法将给你一个关于500个临界点的极其稳定、分布收敛极好的估计结果。不信的等着瞧。相信版上的很多人都有很好的SAS编程技术。按照我说的做一次就行了。反正我是做过的，结果报告在07年的会议文章里。最初是做了500次，后来扩大到50，100，1000。我后来懒得发布结果，因为如果计算程序中不设定限制条件的话，基于强制连续性假设和最优化基础的结果实在太荒谬了。
/***************************************************************************/
/* Title: : Simulation for a Dichotomic Regression
with Julious's Sample */
/* Part I: Data Generation and Random
Check */
/* Author : Ligong Chen, MD, MPH/Biostatistician
*/
/* Affiliation : The Department of Preventive Medicine and
Biometrics, USUHS */
/* Purpose : (1) To Validate Weighted Dichotomic Piecewise
Regression Analysis */
/* (2) To Submit to MITBBS/Statistics for
Communication */
/* Generation Date : January, 2007
*/

/* Generation Place : Center for Prostate Diseases Research (CPDR) in
Rockville, Maryland */
/* Modification Date : May, 2011
*/
/* Modification Place : Home in Rockville, Maryland
*/
/* Julious's Paper : Julious SA. Inference and estimation in a
changepoint regression */
/* problem. The Statistician 2001; 50,
Part 1: 51-61. */
/***************************************************************************/
%let air= ...........\sim500;
libname data "&air.\sas_data";
libname result "&air.\sas_output";
/*===============Generate 500 Simulated Samples, Fit Fullwise Model ========
==========*/
/*==============and Calculate Prediction Error FM_PE for Each Sample========
===========*/
%macro seed(nn);
data seg&nn.1;
format x 8.3 y 6.3;
seed = &nn. ;
segment=1;
do i=1 to 20 ;
x=29.78+7.2*rannor(seed);
y=(0.076+0.042*x)+0.3*rannor(seed);
output;
end ;
run;
/*
Threshold: X_delta = 39.432 */
/*
Y_delta = 1.732 */

data seg&nn.2;
format x 8.3 y 6.3;
seed = &nn. ;
segment=2;
do i=1 to 15 ;
x=51.97+7.0*rannor(seed);
y=(-1.659+0.086*x)+0.35*rannor(seed);
output;
end ;
run;
/*==========Combine Two Segments==============*/
data seg&nn.;
set seg&nn.1 seg&nn.2;
drop i;
run;
proc sort data=seg&nn.;
by x;
run;
data data.simu_di&nn.;
set seg&nn.;
ID=_N_;
run;
proc glm data=data.simu_di&nn. noprint;
model y=x;
output out=FM&nn.(keep=seed ID segment y x yhat resid)
p=yhat r=resid;
run;
quit;
data FM&nn.;
set FM&nn.;
AR=abs(resid); /* Absolute Residuals */
SR=resid*resid; /* Squared Residuals */
run;
/*===============Define SAR, MAR, RSS, MSR and RMSR=================*/
/* PE: Prediction Error, include:
*/
/* SAR: Sum of Absolute Residuals = Sum of abs(AR)
*/
/* MAR: Mean of Absolute Residual = [Sum of abs(AR)]/n
= SAR/n */
/* RSS: Residual Sum of Squares = Sum of SR
*/
/* MSR: Mean of Squared Residuals = RSS/n
*/
/* RMSR: Root Mean of Squared Residuals = sqrt(MSR)
= sqrt(RSS/n); */
/*=======================================================*/
/*===============Calculate SAR, MAR, RSS, MSR======================*/
proc means data=FM&nn. noprint;
var AR SR;
output out=FM_PE&nn. (drop=_freq_ _type_)
sum=SAR RSS
mean=MAR MSR;
run;
/*=======================Calculate RMSR========================*/
data FM_PE&nn.;
set FM_PE&nn.;
RMSR=sqrt(MSR);
run;
%mend;
/*==================== Begin Data Generation======================*/
/* %seed(1); %seed(2); ......;%seed(500); */
%macro multiseed;
%do i=1 %to 500;
%seed(&i);
%end;
%mend;
%multiseed;
/*============Randomly Check the Simulated Dataset=============*/
%macro dat(seg);
Proc gplot data=&seg.;
plot y*x;
run;
%mend;
%dat(seg32); %dat(seg147); %dat(seg211); %dat(seg235); %dat(seg345); %dat(
seg458); %dat(seg492);
/*===================Create Dataset for 500 FM_PEs=====================*/
data result.FM_PE;
set FM_PE1 - FM_PE500;
step=_N_;
run;
/*==================Measurement Consistency among FM_PEs================*/
proc gplot data=result.FM_pe;
plot SAR*RSS;
run;
proc reg data=result.FM_pe;
model SAR=RSS;
run;
proc gplot data=result.FM_pe;
plot MAR*MSR;
run;
proc reg data=result.FM_pe;
model MAR=MSR;
run;
proc gplot data=result.FM_pe;
plot MAR*RMSR;
run;
proc reg data=result.FM_pe;
model MAR=RMSR;
run;
（未完待续）

n*****n
发帖数: 3123

大师，你总这样会得便秘的。
身体健康是第一位的

T*******I
发帖数: 5138

Code很长啊，且有比较部分因而显得复杂，不得不分段发布。
身体健康没问题，从上小学开始就从未因病缺过课，直到上大学时，虽然经常缺课，但
从未因病，而是因为不喜欢上课故而逃课。

【在 n*****n 的大作中提到】

: 大师，你总这样会得便秘的。
: 身体健康是第一位的

c*m
发帖数: 1114

首先临界点这个东西和模型定义相关，有些模型不需要临界点就能把数据回归的很好，
有些模型用含多个临界点的分段模型也未必能回归出好的结果。（比如说polynomial高
阶模型和linear模型的区别）
所以其实应该先讨论下模型选择的合理性，当然这些是题外话：模型没有对错之分，只
有适用不适用之分。
那如果局限于分段linear regression模型，临界点处是不是连续完全取决于你的定义，
你可以假设你的模型在临界点处连续，也可以假设不连续，回归出来的结果针对两种不
同的模型都是正确的。两者的不同之处其实只在于前者比后者多了个连续性的约束。所
以争辩临界模型如何定义更加合理没有太大的意义。
应用中一般都假设模型函数在整个总体中是连续的，这个连续性假设本身并不必要，但
确是一些求解方法的必要前提。现有的大多数优化算法没有连续性这个前提基本无法求
解（那些0阶的优化算法除外）。
所以如果你当然可以做个没有连续性限制的分段线性模型来回归，但现有的大多数优化
算法都不能用(SAS里面的proc glm应该也不能用). 假如说你真的能给出这样一种算法，
还需要进一步讨论它的收敛性收敛半径等细节，否则光提出一种新的分段线性模型毫无
意义。假设你前面这些东西都成功了，那还要比较一下Fitness和Complexity. 很可能人
连续性分段模型回归用了1秒，而你的需要算一个小时。理论上release了连续性的分段
模型fitness会更加好些，实际上并非如此，因为复杂函数的性态往往会产生稳定性/唯
一性等等很多问题，导致求解困难甚至无法求解，从而fitness更加差。
再者，讨论如何更好的定义分段线性模型毫无意义，线性模型正对非线性模型来说优势
在于快捷方便，分段引入临界点的话顶多是在快捷方便的同时试图让fitness更好些。把
分段线性模型弄的太完美也不可能比的上非线性模型。
总结就是，统计这东西只有在承认了它诸多假设的前提下数学才是严谨的，质疑它的前
提假设的话确实整个统计的理论都会被你颠覆。问题是它的那些诸多假设基本上都是为
求解/后续推理的可行性服务的。如果你认为它不对，那需要自己提出一套新的完整的后
续推理/可行的求解方案等才有用。如果你能把统计里那些乱七八糟的假设全部release
掉而形成一套新的可应用的统计理论，恭喜你，你成为了21世纪最伟大的统计学家。

Sample
我在4年多前写的。仅仅作了一点小小的更改。我的code写得很笨拙，但it runs good
。请大家保存好你的500个随机样本。以备后用。
回答是肯定的，你的哲学的或/和数学和/或统计学的逻辑基础是什么？然后再问问你自
己，总体给了你连续性的保证吗？你可以在样本基础上假设总体的连续性吗？为什么？
**/

【在 T*******I 的大作中提到】

: 我准备接受goldmember的挑战公布Code。
: SAS Code (Part I): Simulation for a Dichotomic Regression wirh Julious's Sample
: 我要公布的code仅仅是一个关于dichotomic regression simulation的SAS code。是我在4年多前写的。仅仅作了一点小小的更改。我的code写得很笨拙，但it runs good。请大家保存好你的500个随机样本。以备后用。
: 我将分段公布，这里是第一部分，data generation and random check.
: 这个例子是想要告诉大家，如果你的分析逻辑正确，根本不需要simulation。
: 正如我对goldmember说过，在接受这个挑战前，让我问大家几个问题：
: 如果总体中存在一个临界点，你认为样本临界模型一定在临界点处连续吗？如果你的回答是肯定的，你的哲学的或/和数学和/或统计学的逻辑基础是什么？然后再问问你自己，总体给了你连续性的保证吗？你可以在样本基础上假设总体的连续性吗？为什么？
: 大家回答了我的这几个问题后我再公布后面的正式算法部分。
: 以下是模拟方法说明：
: 在分段回归的问题上只算一个随机样本是远远不够的。我们需要在随机模拟的条件下验证它。所谓随机模拟，就是假如我们用任意一种方法算出一个样本的临界点后，将该样本分为两

w*****8
发帖数: 395

you should use the following to perform those 500 %seed;
%macro multiseed;
%do i=1 %to 500;
%seed(&i);
%end;
%mend;
%multiseed;

A*******s
发帖数: 3942

初看了一下，很难看懂。不过从seed(1)写到seed(500)，大师一定花了很多时间在这上
面。

Sample
我在4年多前写的。仅仅作了一点小小的更改。我的code写得很笨拙，但it runs good
。请大家保存好你的500个随机样本。以备后用。
回答是肯定的，你的哲学的或/和数学和/或统计学的逻辑基础是什么？然后再问问你自
己，总体给了你连续性的保证吗？你可以在样本基础上假设总体的连续性吗？为什么？
**/

【在 T*******I 的大作中提到】

d******e
发帖数: 7844

见识大师的水平了,哈哈哈

【在 w*****8 的大作中提到】

: you should use the following to perform those 500 %seed;
: %macro multiseed;
: %do i=1 %to 500;
: %seed(&i);
: %end;
: %mend;
: %multiseed;

n*****n
发帖数: 3123

好了，大家都high过了。散了吧

g********r
发帖数: 8017

赞！老陈向正确的方向迈出了坚实的一步。这才像个统计师。期待其他code和数据分析
表现。

w****a
发帖数: 114

恩，陈先生，你能不能用这段code取代你那段很长的？这样会短很多呀！

【在 w*****8 的大作中提到】

: you should use the following to perform those 500 %seed;
: %macro multiseed;
: %do i=1 %to 500;
: %seed(&i);
: %end;
: %mend;
: %multiseed;

相关主题
● 怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)	● deviance residual
● normality test mix model	● 2 sample t-test with bootstrap 怎么搞？
● 问一个用simulation的问题	● two-way anova 的F-value 的意义。
进入Statistics版参与讨论

a***g
发帖数: 2761

大家不用嘲笑大师编程不够简洁
这纯粹技术细节
就坐等大师按他那一套能给出什么样的结果了

w***n
发帖数: 1084

我汗啊，想到小时候听过的一个笑话。。。。
有一个小孩跟老师学写字。老师教他学写“一”，小孩一看，这太容易了——“一”就是一横。老师又教他学写“二”，小孩一看，这太容易了——“二”就是两横。老师接着要教他学写“三”，小孩一看，连忙说：“我会了，我会了。‘三’就是三横。”老师说：“你真聪明！”老师走了。隔壁住着一位姓万的先生，他知道小孩会写字，就请小孩帮忙写一个“万”字。小孩以为“万”就是一万横。于是，他写呀写呀，写了一整天还没写完。

g**********t
发帖数: 475

统一，我老板的名言就是code能work就成。

【在 a***g 的大作中提到】

: 大家不用嘲笑大师编程不够简洁
: 这纯粹技术细节
: 就坐等大师按他那一套能给出什么样的结果了

T*******I
发帖数: 5138

hehe, 我不是早说了么？我的程序编得非常笨拙。不过，从%seed(1);到%seed(500);可
不是用手指一键一键敲的，而是在excel中用拖拉式填空并用concatenate函数写的，也很
快的。写好后就copy-paste到SAS中。也没花多少时间。
顺便请教精算兄，我这个随机模拟的目的与CV是否有相似之处？我的感觉是对算法的验
证，而不是对临界点和模型的验证。是吗？

【在 A*******s 的大作中提到】

: 初看了一下，很难看懂。不过从seed(1)写到seed(500)，大师一定花了很多时间在这上
: 面。
:
: Sample
: 我在4年多前写的。仅仅作了一点小小的更改。我的code写得很笨拙，但it runs good
: 。请大家保存好你的500个随机样本。以备后用。
: 回答是肯定的，你的哲学的或/和数学和/或统计学的逻辑基础是什么？然后再问问你自
: 己，总体给了你连续性的保证吗？你可以在样本基础上假设总体的连续性吗？为什么？
: **/

T*******I
发帖数: 5138

This is great. I will take it. Thanks very much!!

【在 w*****8 的大作中提到】

: you should use the following to perform those 500 %seed;
: %macro multiseed;
: %do i=1 %to 500;
: %seed(&i);
: %end;
: %mend;
: %multiseed;

T*******I
发帖数: 5138

没错，你的思想代表了数学背景人士的一种普遍的优越感，因为在他们的眼里统计学不过是应用数学的一个分支，属于低级数学学科。搞数学的根本瞧不起搞统计的（这是陈希孺的原话）。而Peter John Huber正是在中科院的数理统计所批评了这种倾向：他们习惯于以数学的确定性思维模式来解决统计学里的非确定性问题。他并因此而期待着能够有一股来自数学以外的强大力量来改变这种现状。这是他1997年11月在中国的演讲。
我想，你的思想中暴露了统计学里的一些“民科级”的数学家们(即那些还没有在思想深处感受到统计学的思维模式的真正精髓及其与数学思维模式的巨大差别的人，或者是那些还没有完成从数学思维到统计思维的转变的人)有缺陷的思维逻辑。
我们须知，在随机系统中没有什么可以被人为假定，因为一个随机系统等于一个未知系统。既然是未知，又怎么能给定一个结论——空间里的关系是连续的？我在09年的文章就指出了这个假设对于数学式解临界点具有决定性的意义，没有这个假设，从数学的角度将面临一个终极障碍——无解！！！所以，（从数学的角度）必须给定这个假设。然而，一旦给定了这个假设，就等于用了一个根本不存在的确定性取代了一个确定地存在着的非确定性！！！这是一个绝对的错误！从而，一切此类数学式解法在统计学里没有任何意义。
如果说我的上述言论在追求严谨论证和推理的数学头脑们听起来很玄、空洞无物、无法论证的话，那么，这说明他们缺乏最基本的判断能力，即回答“它是什么？”的能力。让我以cem的评论中的一段话作为实例来论证上述观点。
cem说：“如果局限于分段linear regression模型，临界点处是不是连续完全取决于你的定义，你可以假设你的模型在临界点处连续，也可以假设不连续，回归出来的结果针对两种不同的模型都是正确的。两者的不同之处其实只在于前者比后者多了个连续性的约束。所以争辩临界模型如何定义更加合理没有太大的意义。”
“临界点处是不是连续完全取决于你的定义”。这句话（=它）是什么意思？它意味着总体中的临界关系可以完全（=100%）由你（=a statistician）定义（=说了算）。可是，事实（=它）真的是如此吗？当然不是（=总体中的临界关系完全不可以（=100%）由你（=a statistician）定义（=说了算））。所以，我说，有的人甚至无法正确回答“它是什么？”的问题。
其它的评论我就不一一批驳了。愿意做的人可以按照我的上述概念运算模式自己去做习题好了，反正搞数学的人个个会做题。

有些模型用含多个临界点的分段模型也未必能回归出好的结果。（比如说polynomial高
阶模型和linear模型的区别）
所以其实应该先讨论下模型选择的合理性，当然这些是题外话：模型没有对错之分，只
有适用不适用之分。
那如果局限于分段linear regression模型，临界点处是不是连续完全取决于你的定义，
你可以假设你的模型在临界点处连续，也可以假设不连续，回归出来的结果针对两种不
同的模型都是正确的。两者的不同之处其实只在于前者比后者多了个连续性的约束。所
以争辩临界模型如何定义更加合理没有太大的意义。
应用中一般都假设模型函数在整个总体中是连续的，这个连续性假设本身并不必要，但
确是一些求解方法的必要前提。现有的大多数优化算法没有连续性这个前提基本无法求
解（那些0阶的优化算法除外）。
所以如果你当然可以做个没有连续性限制的分段线性模型来回归，但现有的大多数优化
算法都不能用(SAS里面的proc glm应该也不能用). 假如说你真的能给出这样一种算法，
还需要进一步讨论它的收敛性收敛半径等细节，否则光提出一种新的分段线性模型毫无
意义。假设你前面这些东西都成功了，那还要比较一下Fitness和Complexity. 很可能人
连续性分段模型回归用了1秒，而你的需要算一个小时。理论上release了连续性的分段
模型fitness会更加好些，实际上并非如此，因为复杂函数的性态往往会产生稳定性/唯
一性等等很多问题，导致求解困难甚至无法求解，从而fitness更加差。
再者，讨论如何更好的定义分段线性模型毫无意义，线性模型正对非线性模型来说优势
在于快捷方便，分段引入临界点的话顶多是在快捷方便的同时试图让fitness更好些。把
分段线性模型弄的太完美也不可能比的上非线性模型。
总结就是，统计这东西只有在承认了它诸多假设的前提下数学才是严谨的，质疑它的前
提假设的话确实整个统计的理论都会被你颠覆。问题是它的那些诸多假设基本上都是为
求解/后续推理的可行性服务的。如果你认为它不对，那需要自己提出一套新的完整的后
续推理/可行的求解方案等才有用。如果你能把统计里那些乱七八糟的假设全部release
掉而形成一套新的可应用的统计理论，恭喜你，你成为了21世纪最伟大的统计学家。

【在 c*m 的大作中提到】

: 首先临界点这个东西和模型定义相关，有些模型不需要临界点就能把数据回归的很好，
: 有些模型用含多个临界点的分段模型也未必能回归出好的结果。（比如说polynomial高
: 阶模型和linear模型的区别）
: 所以其实应该先讨论下模型选择的合理性，当然这些是题外话：模型没有对错之分，只
: 有适用不适用之分。
: 那如果局限于分段linear regression模型，临界点处是不是连续完全取决于你的定义，
: 你可以假设你的模型在临界点处连续，也可以假设不连续，回归出来的结果针对两种不
: 同的模型都是正确的。两者的不同之处其实只在于前者比后者多了个连续性的约束。所
: 以争辩临界模型如何定义更加合理没有太大的意义。
: 应用中一般都假设模型函数在整个总体中是连续的，这个连续性假设本身并不必要，但

d******e
发帖数: 7844

哈哈哈，陈大师出来嘲笑别人民科了。
真是匪夷所思啊

【在 T*******I 的大作中提到】

: 没错，你的思想代表了数学背景人士的一种普遍的优越感，因为在他们的眼里统计学不过是应用数学的一个分支，属于低级数学学科。搞数学的根本瞧不起搞统计的（这是陈希孺的原话）。而Peter John Huber正是在中科院的数理统计所批评了这种倾向：他们习惯于以数学的确定性思维模式来解决统计学里的非确定性问题。他并因此而期待着能够有一股来自数学以外的强大力量来改变这种现状。这是他1997年11月在中国的演讲。
: 我想，你的思想中暴露了统计学里的一些“民科级”的数学家们(即那些还没有在思想深处感受到统计学的思维模式的真正精髓及其与数学思维模式的巨大差别的人，或者是那些还没有完成从数学思维到统计思维的转变的人)有缺陷的思维逻辑。
: 我们须知，在随机系统中没有什么可以被人为假定，因为一个随机系统等于一个未知系统。既然是未知，又怎么能给定一个结论——空间里的关系是连续的？我在09年的文章就指出了这个假设对于数学式解临界点具有决定性的意义，没有这个假设，从数学的角度将面临一个终极障碍——无解！！！所以，（从数学的角度）必须给定这个假设。然而，一旦给定了这个假设，就等于用了一个根本不存在的确定性取代了一个确定地存在着的非确定性！！！这是一个绝对的错误！从而，一切此类数学式解法在统计学里没有任何意义。
: 如果说我的上述言论在追求严谨论证和推理的数学头脑们听起来很玄、空洞无物、无法论证的话，那么，这说明他们缺乏最基本的判断能力，即回答“它是什么？”的能力。让我以cem的评论中的一段话作为实例来论证上述观点。
: cem说：“如果局限于分段linear regression模型，临界点处是不是连续完全取决于你的定义，你可以假设你的模型在临界点处连续，也可以假设不连续，回归出来的结果针对两种不同的模型都是正确的。两者的不同之处其实只在于前者比后者多了个连续性的约束。所以争辩临界模型如何定义更加合理没有太大的意义。”
: “临界点处是不是连续完全取决于你的定义”。这句话（=它）是什么意思？它意味着总体中的临界关系可以完全（=100%）由你（=a statistician）定义（=说了算）。可是，事实（=它）真的是如此吗？当然不是（=总体中的临界关系完全不可以（=100%）由你（=a statistician）定义（=说了算））。所以，我说，有的人甚至无法正确回答“它是什么？”的问题。
: 其它的评论我就不一一批驳了。愿意做的人可以按照我的上述概念运算模式自己去做习题好了，反正搞数学的人个个会做题。
:
: 有些模型用含多个临界点的分段模型也未必能回归出好的结果。（比如说polynomial高
: 阶模型和linear模型的区别）

s*****r
发帖数: 790

大师别的水平不知道，但是一行code可以实现的，大师可以用10行来完成。
还有自己的学位，title. 你的md你觉得和大家在这边所理解的是一样的么？
哈哈
这个本事在另外一个贴里讨论过了。我觉得大师还是知道生存知道的。

【在 T*******I 的大作中提到】

: Code很长啊，且有比较部分因而显得复杂，不得不分段发布。
: 身体健康没问题，从上小学开始就从未因病缺过课，直到上大学时，虽然经常缺课，但
: 从未因病，而是因为不喜欢上课故而逃课。

T*******I
发帖数: 5138

别在此蛊惑人心。我没有特指谁谁谁，而是指的一类人或现象，并且给出了明确的定义
：什么是统计学的里的“民科级”数学家？
诸位都把自己藏得好好的。不像我，奋不顾家人地露了馅。没办法，已经被骂得够雪林
头了。即便如此，我该说啥还是得说，该干啥也还是得干。我决不会与版上或身边的任
何人积垢。

【在 d******e 的大作中提到】

: 哈哈哈，陈大师出来嘲笑别人民科了。
: 真是匪夷所思啊

T*******I
发帖数: 5138

那只象征一个教育的经历，而非水平。但我要是不写的话，我那5年的人生岂不是空白
？我的医学院的5年经历岂不是在吃干饭？在医学院里搞生物统计不懂医学，能干啥？
主动性和创造性何在？
如果你也有这么一段经历，你是藏着掖着，还是如实写出来呢？

【在 s*****r 的大作中提到】

: 大师别的水平不知道，但是一行code可以实现的，大师可以用10行来完成。
: 还有自己的学位，title. 你的md你觉得和大家在这边所理解的是一样的么？
: 哈哈
: 这个本事在另外一个贴里讨论过了。我觉得大师还是知道生存知道的。

相关主题
● regression后的residual是个双峰分布	● A question about regression
● residual～predict plot出现这个样子，说明了什么？	● Question Proc GENMOD
● R lm一问	● 问个SAS regression问题
进入Statistics版参与讨论

s*****r
发帖数: 790

你写吧。关我屁事。
不过我知道你这个md是什么而已。就像我知道有很多非常非常crappy的
biostatistician 一样。

【在 T*******I 的大作中提到】

: 那只象征一个教育的经历，而非水平。但我要是不写的话，我那5年的人生岂不是空白
: ？我的医学院的5年经历岂不是在吃干饭？在医学院里搞生物统计不懂医学，能干啥？
: 主动性和创造性何在？
: 如果你也有这么一段经历，你是藏着掖着，还是如实写出来呢？

T*******I
发帖数: 5138

说真的，别嘲笑人了。搞统计对于任何人都是困难的。这是一位大统计学家说过的话。我想这个原因主要是由于统计学是在认识外部未知世界，而不是在数学的公理体系（已知的系统）下推导结论，也不是在医学实验室中按照既定的程序操作仪器设备或检测生物材料。它是人类的心智所面临的最大的挑战。真的是终极地困难。
此外，并非每个md都必须做临床医生，会看病。医学的学科已经多样化交叉化了，因而md的内涵早就发生了巨大的变化。

【在 s*****r 的大作中提到】

: 你写吧。关我屁事。
: 不过我知道你这个md是什么而已。就像我知道有很多非常非常crappy的
: biostatistician 一样。

s*****r
发帖数: 790

你知道困难？
几乎所有搞统计的都知道困难，所以做结论都非常谨慎，所以才说，我们从不犯错（因
为都是可能性）。所以才要一步一步验证。
您最厉害，逻辑正确就不需要验证了。

【在 T*******I 的大作中提到】

: 说真的，别嘲笑人了。搞统计对于任何人都是困难的。这是一位大统计学家说过的话。我想这个原因主要是由于统计学是在认识外部未知世界，而不是在数学的公理体系（已知的系统）下推导结论，也不是在医学实验室中按照既定的程序操作仪器设备或检测生物材料。它是人类的心智所面临的最大的挑战。真的是终极地困难。
: 此外，并非每个md都必须做临床医生，会看病。医学的学科已经多样化交叉化了，因而md的内涵早就发生了巨大的变化。

T*******I
发帖数: 5138

“逻辑正确就不需要验证了。”

c*m
发帖数: 1114

鸡同鸭讲，亏老夫吃饱了撑着给你码了这么多字。
如果你所谓的随机模拟试验用的是SAS的PROC GLM之流，那结果在临界点不连续的情况
下大多是错误的（基本你需要写你的C或者Fortran code来测试并有理论上的收敛及收
敛半径分析).

【在 T*******I 的大作中提到】

: “逻辑正确就不需要验证了。”

T*******I
发帖数: 5138

可以这么说，我们俩都是在各自的概念内各说各的话。我不需要你的那些概念（收敛半
径）。当然，你完全可以用你的这个概念和算法去检查我的收敛半径如何。我相信你会
被震撼住。不信的话，让我们等着瞧。
经过一个严谨的逻辑分析，在这个领域里，临界点是且只能是一个加权期望估计，而不
是任何其它估计。因此，统计的任务就是要构造一个唯一正确的权重测量。

【在 c*m 的大作中提到】

: 鸡同鸭讲，亏老夫吃饱了撑着给你码了这么多字。
: 如果你所谓的随机模拟试验用的是SAS的PROC GLM之流，那结果在临界点不连续的情况
: 下大多是错误的（基本你需要写你的C或者Fortran code来测试并有理论上的收敛及收
: 敛半径分析).

s*****r
发帖数: 790

So unluckily, I don't have your logic, neither do other people here. It is
even unlucky that science does not follow your logic so we have advanced so
much.
do not use any terms you do not understand, You know what "weight" is, why
there are so many different versions of weights for the same data set?
How many variables do you see in reality? how many and which variables
should you include in your model? No validation? Yeah, you are the God, you
can imagine you are right.
Why the hell do you do modeling if you already know it?

【在 T*******I 的大作中提到】

: “逻辑正确就不需要验证了。”

T*******I
发帖数: 5138

关于weight的multiple versions，你提出的问题是学术界很关心的问题。我离开前面
提到的那位GW的统计学教授之前，曾给他详细介绍并讲解了自权重定义的哲学基础，他
也对我提过这个问题。我告诉他，我可以定义成百上千乃至更过的权重，但只有唯一的
一个是无偏的，因而是正确的。随机模拟试验验证了这个结论。
而如何为随机变量定义唯一正确的权重不是一个数学问题，而是一个充满智慧的哲学问
题。

so
you

【在 s*****r 的大作中提到】

: So unluckily, I don't have your logic, neither do other people here. It is
: even unlucky that science does not follow your logic so we have advanced so
: much.
: do not use any terms you do not understand, You know what "weight" is, why
: there are so many different versions of weights for the same data set?
: How many variables do you see in reality? how many and which variables
: should you include in your model? No validation? Yeah, you are the God, you
: can imagine you are right.
: Why the hell do you do modeling if you already know it?

s*****r
发帖数: 790

yeah, you are the GOD and you know it is the only right one. I bet you don'
t believe in God truly since you must think you should be the one that's
been worshiped.

【在 T*******I 的大作中提到】

: 关于weight的multiple versions，你提出的问题是学术界很关心的问题。我离开前面
: 提到的那位GW的统计学教授之前，曾给他详细介绍并讲解了自权重定义的哲学基础，他
: 也对我提过这个问题。我告诉他，我可以定义成百上千乃至更过的权重，但只有唯一的
: 一个是无偏的，因而是正确的。随机模拟试验验证了这个结论。
: 而如何为随机变量定义唯一正确的权重不是一个数学问题，而是一个充满智慧的哲学问
: 题。
:
: so
: you

d******e
发帖数: 7844

大师的思维还停留在无偏的就是正确的水平上。
大师可以去试试看，X1,X2独立同分布，那么－10000X1＋10001X2一样是mean的无偏估计
。难道因为这个无偏了，就是正确的了？
这种基本的问题都不明白，还在敢在那里谈哲学，真TMD扯淡。

【在 T*******I 的大作中提到】

相关主题
● 为什么数据‘看起来’不错，可是R^2却很低	● can someone please translate this into english for me?
● 这种方法在regression有效吗	● Residual and Partial Correlation
● 请问一道joint hypothesized test 的题目	● How to read in binary data in SAS
进入Statistics版参与讨论

c********r
发帖数: 520

为什么是唯一的一个是正确的，为啥不是两个，或者3个，或者是几个的函数表达式？有或者是更不就不存在，你是如何证明的？

【在 T*******I 的大作中提到】

d******e
发帖数: 7844

他根本就证不出来，在那里YY罢了。

？有或者是更不就不存在，你是如何证明的？

【在 c********r 的大作中提到】

: 为什么是唯一的一个是正确的，为啥不是两个，或者3个，或者是几个的函数表达式？有或者是更不就不存在，你是如何证明的？

s*****r
发帖数: 790

come on, he doesn't know what bias means.
whenever you are talking a specific statistical concept, you should expect
that his def will be completely different so you are asking the wrong
question.

估计

【在 d******e 的大作中提到】

: 大师的思维还停留在无偏的就是正确的水平上。
: 大师可以去试试看，X1,X2独立同分布，那么－10000X1＋10001X2一样是mean的无偏估计
: 。难道因为这个无偏了，就是正确的了？
: 这种基本的问题都不明白，还在敢在那里谈哲学，真TMD扯淡。

T*******I
发帖数: 5138

I am not the GOD. I just try to find it and then to answer "What is it?".

don'

【在 s*****r 的大作中提到】

: yeah, you are the GOD and you know it is the only right one. I bet you don'
: t believe in God truly since you must think you should be the one that's
: been worshiped.

s*****r
发帖数: 790

you are not? You already claim your conclusion is the only right one. No
statistician, even human being, would claim that.

【在 T*******I 的大作中提到】

: I am not the GOD. I just try to find it and then to answer "What is it?".
:
: don'

T*******I
发帖数: 5138

我想你首先要搞清楚理论假设与现实世界的区别，然后再来讨论统计学。统计学永远是
与现实世界打交道，而不是玩什么理论假设。否则就是真TMD扯淡了。

估计

【在 d******e 的大作中提到】

T*******I
发帖数: 5138

If you would like to play with this rule, your mind should go to mad.
You must know what it is at first if you try to define a weight.

？有或者是更不就不存在，你是如何证明的？

【在 c********r 的大作中提到】

: 为什么是唯一的一个是正确的，为啥不是两个，或者3个，或者是几个的函数表达式？有或者是更不就不存在，你是如何证明的？

T*******I
发帖数: 5138

Can you prove that you are not yourself? Do you need to prove that you are
yourself?

【在 d******e 的大作中提到】

: 他根本就证不出来，在那里YY罢了。
:
: ？有或者是更不就不存在，你是如何证明的？

T*******I
发帖数: 5138

That is because you don't have that logic.

【在 s*****r 的大作中提到】

: you are not? You already claim your conclusion is the only right one. No
: statistician, even human being, would claim that.

a***g
发帖数: 2761

我还可以肯定的说统计不仅是和现实打交道，还真就是玩理论假设
为什么最早的线性回归都假设残差服从正态分布？
为什么初期的降维的回归理论都假设待降维的变量是椭圆对称的？
为什么很多时候排队系统都假设服从泊松分布？
因为统计不仅要考虑其出发点的合理性，还要考虑其工作的可行性，这些假设基本符合
研究对象某些情况下的数据特点，这是合理性；同时这么假设，人们才能用计算出来，
这是可行性。
理论处理不了的现实问题太多太多，而发展一套出发点合理的又在计算工具上可行的理
论假设才是有意义的，这项工作的难度比发现现有理论假设什么情况下不适用可困难太
多了。发现点什么，其实只要参与这项工作就能发现，可是解决点什么，不是用嘴巴说
说就行的。
另：统计还就真是TMD扯淡的学科。

【在 T*******I 的大作中提到】

: 我想你首先要搞清楚理论假设与现实世界的区别，然后再来讨论统计学。统计学永远是
: 与现实世界打交道，而不是玩什么理论假设。否则就是真TMD扯淡了。
:
: 估计

相关主题
● How to read in binary data in SAS	● normality test mix model
● ask help for a paper on MI by Lu kaifeng 2010	● 问一个用simulation的问题
● 怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)	● deviance residual
进入Statistics版参与讨论

T*******I
发帖数: 5138

“统计还就真是TMD扯淡的学科。”

c********r
发帖数: 520

靠你太牛了，难怪你的逻辑没有办法fit 进数学的框架。你的逻辑是
因为你认为的逻辑推理是严谨的（建立在哲学的高度）---》你的解是唯一的正确解，
又因为你的解是唯一的正确解，所以你的推理逻辑是不需要证明的。
这个正么和李大师的逻辑很像，
应为他是全宇宙最大的神----》他说的都是对的，又因为他说的都是对的，所以他是
全宇宙唯一的神。
看来的确是我的level 太低。

【在 T*******I 的大作中提到】

: If you would like to play with this rule, your mind should go to mad.
: You must know what it is at first if you try to define a weight.
:
: ？有或者是更不就不存在，你是如何证明的？

c********r
发帖数: 520

你对统计这门学科的理解太狭隘了，或者说我理解的统计和你所说的统计学应该不是一
回事。

【在 T*******I 的大作中提到】

s*****r
发帖数: 790

I admitted it long time ago, and I feel so fortunate that I don't have that
one.
You sure have that logic, but unfortunately nobody would be able to
understand. Don't tell me your wife understand it although she is gonna
talk about your new horizon. I bet she does not. If she is the same type of
yours, she will have her logic which is not yours.
speechless

【在 T*******I 的大作中提到】

: That is because you don't have that logic.

T*******I
发帖数: 5138

这就没办法了。
搞统计的人都是与随机事件打交道的。如果大家即将从这个“两分法随机模拟试验”中发现我所陈述的是一个事实，但我所说的那个强大的逻辑对你来说可能仅仅是一个随机事件而存在的话，那么，你们从“统计学的新地平线——陈立功与他的自权重曲线”一文中看到的就是关于此陈述的另一个事实。如果我说在其它情形下也发生着同类的事情，而这种同一类事实重复发生多次乃至无数次，你觉得它（那个逻辑）依然是随机事件吗？

，

【在 c********r 的大作中提到】

: 靠你太牛了，难怪你的逻辑没有办法fit 进数学的框架。你的逻辑是
: 因为你认为的逻辑推理是严谨的（建立在哲学的高度）---》你的解是唯一的正确解，
: 又因为你的解是唯一的正确解，所以你的推理逻辑是不需要证明的。
: 这个正么和李大师的逻辑很像，
: 应为他是全宇宙最大的神----》他说的都是对的，又因为他说的都是对的，所以他是
: 全宇宙唯一的神。
: 看来的确是我的level 太低。

s*****r
发帖数: 790

you see, you should first give up using the word "random", or learn its
meaning since you have no clue what "random" means.

中发现我所陈述的是一个事实，但我所说的那个强大的逻辑对你来说可能仅仅是一个随
机事件而存在的话，那么，你们从“统计学的新地平线——陈立功与他的自权重曲线”
一文中看到的就是关于此陈述的另一个事实。如果我说在其它情形下也发生着同类的事
情，而这种同一类事实重复发生多次乃至无数次，你觉得它（那个逻辑）依然是随机事
件吗？

【在 T*******I 的大作中提到】

: 这就没办法了。
: 搞统计的人都是与随机事件打交道的。如果大家即将从这个“两分法随机模拟试验”中发现我所陈述的是一个事实，但我所说的那个强大的逻辑对你来说可能仅仅是一个随机事件而存在的话，那么，你们从“统计学的新地平线——陈立功与他的自权重曲线”一文中看到的就是关于此陈述的另一个事实。如果我说在其它情形下也发生着同类的事情，而这种同一类事实重复发生多次乃至无数次，你觉得它（那个逻辑）依然是随机事件吗？
:
: ，

a***g
发帖数: 2761

滚你妈的有种没种，拿你当个人才好话好说的，谁他妈知道你什么鸡巴问题，我回答个
鸡巴。搁这图痛快满嘴乱喷，麻痹的给脸不要脸，看你平时能蹦出几句人话，还真没瞧
出你杂碎本色

计真就是玩理论假设，为什么没种回答我在首贴里问大家的那几个关于连续性假设的问
题？你可以回答说Yes啊？为什么不回答呢？

【在 T*******I 的大作中提到】

: “统计还就真是TMD扯淡的学科。”

d******e
发帖数: 7844

淡定淡定，轻描淡写的骂一句“脑残”足矣，对陈大师应该投以轻蔑的目光和姿态。
他根本犯不着你动怒。
来来来，跟我一起说，“陈立功是脑残，陈立功是脑残”。

【在 a***g 的大作中提到】

: 滚你妈的有种没种，拿你当个人才好话好说的，谁他妈知道你什么鸡巴问题，我回答个
: 鸡巴。搁这图痛快满嘴乱喷，麻痹的给脸不要脸，看你平时能蹦出几句人话，还真没瞧
: 出你杂碎本色
:
: 计真就是玩理论假设，为什么没种回答我在首贴里问大家的那几个关于连续性假设的问
: 题？你可以回答说Yes啊？为什么不回答呢？

a***g
发帖数: 2761

个人修养还没到啊
惭愧惭愧

【在 d******e 的大作中提到】

: 淡定淡定，轻描淡写的骂一句“脑残”足矣，对陈大师应该投以轻蔑的目光和姿态。
: 他根本犯不着你动怒。
: 来来来，跟我一起说，“陈立功是脑残，陈立功是脑残”。

g********r
发帖数: 8017

个人修养难啊。看看这个预言共勉吧。我没有说陈大师的意思。生活中很多annoying的事情没法控制。
从前，有一位赫赫有名的哈里发，他的威力和权势以及美丽豪华的宫殿，人人称赞，举
世闻名。一天，有位学者求见。此人博学多才，无所不知，尤其精通神学。他被带来见
哈里发。他们坐在会客厅里。当时，正值盛夏，苍蝇嗡嗡乱飞，惹得哈里发非常恼火。
他向这位学者请教道：“为什么要有苍蝇？万能的上帝创造它们干什么？这些东西不仅
毫无用处，而巨实在讨厌和肮脏。”
学者回答道：“啊，您这位伟大的君主和上帝的使者，世上没有一样东西上帝没有
目的、随随便便创造出来的。上帝创造了苍蝇，是为了用它们揭示世上那些强者的弱处
。瞧，他们自以为强大无比，却对一只如此弱小的飞虫束手无策。因此，亲爱的王上，
万能的上帝是多么需要苍蝇啊！”
哈里发对神学者的见解感到非常高兴。从此，他对苍蝇给他带来的苦恼再也不发牢
骚了。

【在 a***g 的大作中提到】

: 个人修养还没到啊
: 惭愧惭愧

相关主题
● 2 sample t-test with bootstrap 怎么搞？	● residual～predict plot出现这个样子，说明了什么？
● two-way anova 的F-value 的意义。	● R lm一问
● regression后的residual是个双峰分布	● A question about regression
进入Statistics版参与讨论

T*******I
发帖数: 5138

我正在苦思什么是randomness。我虽有一点感觉，但你既然指出我have no clue what
"random" means. 那么，我很愿意倾听你谈谈如何理解它，算作交流吧。

【在 s*****r 的大作中提到】

: you see, you should first give up using the word "random", or learn its
: meaning since you have no clue what "random" means.
:
: 中发现我所陈述的是一个事实，但我所说的那个强大的逻辑对你来说可能仅仅是一个随
: 机事件而存在的话，那么，你们从“统计学的新地平线——陈立功与他的自权重曲线”
: 一文中看到的就是关于此陈述的另一个事实。如果我说在其它情形下也发生着同类的事
: 情，而这种同一类事实重复发生多次乃至无数次，你觉得它（那个逻辑）依然是随机事
: 件吗？

s*****r
发帖数: 790

sorry, as I said before, I will not educate or discuss with you any specific
statistical concept.
why don't you go learn by yourself? there are plenty of statistic 101.

what

【在 T*******I 的大作中提到】

: 我正在苦思什么是randomness。我虽有一点感觉，但你既然指出我have no clue what
: "random" means. 那么，我很愿意倾听你谈谈如何理解它，算作交流吧。

T*******I
发帖数: 5138

首贴中的code已更新到第二部分计算加权的两分法。采用了5个定义近似的权重，结果
几乎一致。

s*****r
发帖数: 790

you really think people here will waste time to check your code?

【在 T*******I 的大作中提到】

: 首贴中的code已更新到第二部分计算加权的两分法。采用了5个定义近似的权重，结果
: 几乎一致。

T*******I
发帖数: 5138

为什么要这样说呢？这个code有什么错误吗？运行一下这个code，看看能带给你什么样
的结果有什么坏处吗？我就搞不懂，接受一个新的东西对于你这么难。

【在 s*****r 的大作中提到】

: you really think people here will waste time to check your code?

s*****r
发帖数: 790

in contrast, I like to try new methods. but it doesn't mean that I should
try what shit tastes although I never did.
have your tried shit? why don't you give a try and maybe you will find you
like it. You see some Japanese do like it. But unfortunately I am not that
revolutionary.
in fact we are all wondering why it is so difficult for you to acknowledge your weakness and learn new things. We have told you so many new and fundamental concepts, have you ever taken any one? Have you ever tried to understand it then decided whether you like it or not? NO. You have NEVER done that. At least we tried to understand your theory and at the very beginning pointed out the problems and don't think we need to continue.

【在 T*******I 的大作中提到】

: 为什么要这样说呢？这个code有什么错误吗？运行一下这个code，看看能带给你什么样
: 的结果有什么坏处吗？我就搞不懂，接受一个新的东西对于你这么难。

g********r
发帖数: 8017

证明新东西有用，举证责任在作者。

【在 T*******I 的大作中提到】

T*******I
发帖数: 5138

强词夺理。我已举证在此。它们是500个随机生成的样本和我的加权两分回归分析的
code。Just copy-paste it to your SAS and run it, then you will have a
distribution of the 500 weigthed mean thresholds. Take a look and make your
judgment. That is it. Simple.
I will post the part III, which based on optimization and enforced
continuity assumption without any other assumption. The result (a
distribution of the 500 thresholds estimated in this way) is absurd.
If this is not the evidence, what else should be?

【在 g********r 的大作中提到】

: 证明新东西有用，举证责任在作者。

A*******s
发帖数: 3942

一般来说碰到大师都会历经三个阶段：
1. 妄图耐心说服大师
2. 发现大师左耳进右耳出，郁闷后抓狂
3. 淡定了
你还在第二阶段，哈哈

【在 a***g 的大作中提到】

: 个人修养还没到啊
: 惭愧惭愧

s*****r
发帖数: 790

nonsense. using simulation to check a method is not that simple. You have
just done one most simple simulation, which is far from completion. you have
to check many scenarios. I am sure you don't know what I am talking about.

your

【在 T*******I 的大作中提到】

: 强词夺理。我已举证在此。它们是500个随机生成的样本和我的加权两分回归分析的
: code。Just copy-paste it to your SAS and run it, then you will have a
: distribution of the 500 weigthed mean thresholds. Take a look and make your
: judgment. That is it. Simple.
: I will post the part III, which based on optimization and enforced
: continuity assumption without any other assumption. The result (a
: distribution of the 500 thresholds estimated in this way) is absurd.
: If this is not the evidence, what else should be?

相关主题
● Question Proc GENMOD	● 这种方法在regression有效吗
● 问个SAS regression问题	● 请问一道joint hypothesized test 的题目
● 为什么数据‘看起来’不错，可是R^2却很低	● can someone please translate this into english for me?
进入Statistics版参与讨论

d******e
发帖数: 7844

第三个阶段就是想逗一逗大师的时候就出现,娱乐娱乐。不想逗的时候就当大师不存在。

【在 A*******s 的大作中提到】

: 一般来说碰到大师都会历经三个阶段：
: 1. 妄图耐心说服大师
: 2. 发现大师左耳进右耳出，郁闷后抓狂
: 3. 淡定了
: 你还在第二阶段，哈哈

d******e
发帖数: 7844

哈哈哈，几乎所有人都会在回复结束的时候补上最后一句

have
.

【在 s*****r 的大作中提到】

: nonsense. using simulation to check a method is not that simple. You have
: just done one most simple simulation, which is far from completion. you have
: to check many scenarios. I am sure you don't know what I am talking about.
:
: your

T*******I
发帖数: 5138

I tried to lead all you guys back to the 1950's, which is the beginning of the
piecewise regression, and let you know how everything has happened, and how
everything should be done. We are misled during the past decades.

【在 s*****r 的大作中提到】

g**********t
发帖数: 475

老杨说科学研究到极致是哲学，哲学研究到极致是宗教。大师比我们高N个数量级，我
等凡夫俗子是不会懂的。

，

【在 c********r 的大作中提到】

g********r
发帖数: 8017

你的方法叫三分好不好？三分的结果呢？
直接把结果贴出来。让别人做实验不叫举证。

your

【在 T*******I 的大作中提到】

T*******I
发帖数: 5138

上帝把一切东西带到那人面前，看他叫它们什么，它们就有名字了。
我的方法是将一个可连续测量的样本空间分为低、中和高三个部分，且需要检验两个临界点是否一致；如果一致就是两分法，因此，两分法只是三分法的一个特例而已。
我已经重复这句话好几次了：我的三分法的应用实例的分析结果公布在07年的JSM proceedings.　这是一个关于冠心病的多变量logistic模型的分段拟合（piecewised fitting），且是三分段拟合。

【在 g********r 的大作中提到】

: 你的方法叫三分好不好？三分的结果呢？
: 直接把结果贴出来。让别人做实验不叫举证。
:
: your

s*****r
发帖数: 790

你那个JSM proceeding paper 没人愿意去看。
你就直接分析给你那个数据吧。多么直接了当？如果真象你说的那么神奇，简直立马秒
杀所有人。并且绝对真正成名。
你唧唧歪歪这么久,何必呢？

【在 T*******I 的大作中提到】

: 上帝把一切东西带到那人面前，看他叫它们什么，它们就有名字了。
: 我的方法是将一个可连续测量的样本空间分为低、中和高三个部分，且需要检验两个临界点是否一致；如果一致就是两分法，因此，两分法只是三分法的一个特例而已。
: 我已经重复这句话好几次了：我的三分法的应用实例的分析结果公布在07年的JSM proceedings.　这是一个关于冠心病的多变量logistic模型的分段拟合（piecewised fitting），且是三分段拟合。

T*******I
发帖数: 5138

我已经算出了我的结果，并当众发布了。我也将详细的算法公布在０９年的文章里，人
们完全可以将它翻译成ＳＡＳ　ｃｏｄｅ去分析自己的样本，并进一步检验我的方法是
否有意义。
我已经告诉了每个人怎么做，难道还要我代替每个人做吗？

【在 s*****r 的大作中提到】

: 你那个JSM proceeding paper 没人愿意去看。
: 你就直接分析给你那个数据吧。多么直接了当？如果真象你说的那么神奇，简直立马秒
: 杀所有人。并且绝对真正成名。
: 你唧唧歪歪这么久,何必呢？

s*****r
发帖数: 790

不是说了，没人愿意去看你的革命性的文章。
推广一个新方法的一个通常做法，就是分析一个大家都知道结果的数据，看看你的方法
好在什么地方。
现在不是就要你分析一个数据么？你愿意积极歪歪说那么多，为什么不愿意花几秒钟运
行一下你的程序分析一下那个数据呢？
这么好的让大家接受的方法你不用，何必呢？

【在 T*******I 的大作中提到】

: 我已经算出了我的结果，并当众发布了。我也将详细的算法公布在０９年的文章里，人
: 们完全可以将它翻译成ＳＡＳ　ｃｏｄｅ去分析自己的样本，并进一步检验我的方法是
: 否有意义。
: 我已经告诉了每个人怎么做，难道还要我代替每个人做吗？

c****l
发帖数: 53

你自己的理论, 自己不"做"给别人看,还指望别人替你做? (你的目的是在向别人推广你
的理论, 让别人接受和相信, 不是么? 你不应该主动点么? 就像发paper一样, 你要
写一个含有完整methods和results的paper才能投出去,不然让reviewers来帮你写程序,做这做那,
来验证你的结果?)
首先你这个态度就不是想用证据来说服别人相信你的理论
光凭你这个绕来绕去回答问题的态度, 我就觉得你这个人挺"虚"的, 再此基础之上,
很难相信你这个方法能有多 "实在"

【在 T*******I 的大作中提到】

相关主题
● can someone please translate this into english for me?	● ask help for a paper on MI by Lu kaifeng 2010
● Residual and Partial Correlation	● 怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)
● How to read in binary data in SAS	● normality test mix model
进入Statistics版参与讨论

m******n
发帖数: 354

我真受不了你们了，耐心好得都跟圣人似的，跟一个有典型精神病症状的偏执狂能扯那
么久，你们个个不亦君子乎。我算是进不了第3阶段了，算了还是忍忍不骂了

T*******I
发帖数: 5138

确实，平均数是用来描述分布的集中趋势的。你站住了立场，值得祝贺。

【在 m******n 的大作中提到】

: 我真受不了你们了，耐心好得都跟圣人似的，跟一个有典型精神病症状的偏执狂能扯那
: 么久，你们个个不亦君子乎。我算是进不了第3阶段了，算了还是忍忍不骂了

a******y
发帖数: 876

IS THERE ANY POSSIBLE TO GET A CORRECT LOTTERY NUMBER? OR JUST VERY CLOSE
NUMBER?

中发现我所陈述的是一个事实，但我所说的那个强大的逻辑对你来说可能仅仅是一个随
机事件而存在的话，那么，你们从“统计学的新地平线——陈立功与他的自权重曲线”
一文中看到的就是关于此陈述的另一个事实。如果我说在其它情形下也发生着同类的事
情，而这种同一类事实重复发生多次乃至无数次，你觉得它（那个逻辑）依然是随机事
件吗？

【在 T*******I 的大作中提到】

B****k
发帖数: 188

“我告诉他，我可以定义成百上千乃至更多的权重，但只有唯一的一个是无偏的，因而
是正确的。”
这个所谓的无偏权重不是唯一的。你可以通过Empirical likelihood构建任意多组所谓
的无偏权重。

【在 T*******I 的大作中提到】

k*******r
发帖数: 16963

不得不说，大师的code写得真是个悲剧。不过大师还是很可爱的，有这么多时间灌水陪
大家娱乐。

T*******I
发帖数: 5138

我知道我的code写得很不精炼，但对于初级的SAS程序员来说应该看得懂，程序的运行
绝对没有问题，结果也不会有错误。如果你觉得繁琐，就请你帮助修改吧。

【在 k*******r 的大作中提到】

: 不得不说，大师的code写得真是个悲剧。不过大师还是很可爱的，有这么多时间灌水陪
: 大家娱乐。

(共1页)

进入Statistics版参与讨论

相关主题
● Question Proc GENMOD	● ask help for a paper on MI by Lu kaifeng 2010
● 问个SAS regression问题	● 怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)
● 为什么数据‘看起来’不错，可是R^2却很低	● normality test mix model
● 这种方法在regression有效吗	● 问一个用simulation的问题
● 请问一道joint hypothesized test 的题目	● deviance residual
● can someone please translate this into english for me?	● 2 sample t-test with bootstrap 怎么搞？
● Residual and Partial Correlation	● two-way anova 的F-value 的意义。
● How to read in binary data in SAS	● regression后的residual是个双峰分布

相关话题的讨论汇总
话题: fm话题: nn话题: data话题: seed话题: pe

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天