由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请问你们在上交结果之前都做哪些检查?
相关主题
问个outlier 和 sample size 的问题哈请教大家一个关于check normality的问题
建模过程中对于outlier的处理问题补充一点统计方面的面试经验 (转载)
做linear reg怎么去掉outlier?正态分布,请教!
问个SAS 基本问题,请大家帮忙。请教如何做normalization,找峰值
求教, clinical trial中如何处理missing value 和outlier原来还有too much statistical power这么一说 (转载)
问一个technical question的回答方法请教 这个GLM问题如何回答
请问R里面哪个MCMC(或者metropolis-hastings)的package里的proposal density可以用户定义的A question on one-step vs. Two-step regression
请教一下大家想准备统计面试的题目,应该看什么资料呢〉?diagnostic medicine 这个方向好找industry 的工作么
相关话题的讨论汇总
话题: model话题: 结果话题: 实际意义话题: normality
进入Statistics版参与讨论
1 (共1页)
q**j
发帖数: 10612
1
用普通的regresson来说:
差不差residual plot against dependent variables?
做不做test of normality?
找不找influential observation?
都做什么样的robustness check?
一般什么方式,步骤比较有效?取取经。
s*r
发帖数: 2757
2
only do planned analyses

【在 q**j 的大作中提到】
: 用普通的regresson来说:
: 差不差residual plot against dependent variables?
: 做不做test of normality?
: 找不找influential observation?
: 都做什么样的robustness check?
: 一般什么方式,步骤比较有效?取取经。

s*****n
发帖数: 2174
3
在学校里写report都做.
工作中都不做, fit个lm()就不错了.

【在 q**j 的大作中提到】
: 用普通的regresson来说:
: 差不差residual plot against dependent variables?
: 做不做test of normality?
: 找不找influential observation?
: 都做什么样的robustness check?
: 一般什么方式,步骤比较有效?取取经。

q**j
发帖数: 10612
4
一?你们那里不是要求各种model的说?marketing里面的survey可以experiment。我以
为对各种technical的东西更注重细节。

【在 s*****n 的大作中提到】
: 在学校里写report都做.
: 工作中都不做, fit个lm()就不错了.

s*****n
发帖数: 2174
5
你说的这些 model diagnostics 和统计 model 本身关系不大,
主要是用于让 model 或者 conclusion 更可信, 属于典型
的"忽悠"的范畴. 如果工作中, 不用这些就能把别人忽悠住,
或者是没人 challenge 你的 finding, 就没必要做这些.

【在 q**j 的大作中提到】
: 一?你们那里不是要求各种model的说?marketing里面的survey可以experiment。我以
: 为对各种technical的东西更注重细节。

q**j
发帖数: 10612
6
哈哈,我没有你cynical。我还是比较care的。我打算formalize一些列test。以后像例
行程序一样,每次过一遍。
s*****n
发帖数: 2174
7
问题在于, formalize一系列diagnostics的意义在什么呢,
比如做了一个linear regression, 结果可以解释的通,
可是diagnostics里面有一(两)个test结果不理想,
是推翻原model呢, 还是将就凑合了呢.
如果不完美的diagnostics结果能推翻原model, 那么现实社会
中90%的model都得被推翻. 如果将就凑合了, 那做diagnostics
的意义在什么呢?

【在 q**j 的大作中提到】
: 哈哈,我没有你cynical。我还是比较care的。我打算formalize一些列test。以后像例
: 行程序一样,每次过一遍。

q**j
发帖数: 10612
8
如果你发现不完美的东西是由于某几个有问题的observatoin造成的,或者是由于
heteroskysticity (sorry wrong spelling),而你把它们改正了,结果就变好了呢?

【在 s*****n 的大作中提到】
: 问题在于, formalize一系列diagnostics的意义在什么呢,
: 比如做了一个linear regression, 结果可以解释的通,
: 可是diagnostics里面有一(两)个test结果不理想,
: 是推翻原model呢, 还是将就凑合了呢.
: 如果不完美的diagnostics结果能推翻原model, 那么现实社会
: 中90%的model都得被推翻. 如果将就凑合了, 那做diagnostics
: 的意义在什么呢?

s*****n
发帖数: 2174
9
当然这种情况是有的, 不过绝大多数情况,
即使发现outliers也不好轻易改正吧.
毕竟data是真实的, model是假设的.
当然可以换model, 比如改用robust reg
最后的结果, 还未必哪个更有意义呢.
考虑的问题越多, 其实引入的noise就越多,
往往也会把问题不必要的复杂化. 我是觉得
做统计, 能简单的就不要复杂, 能做一步的
就别做两步, 能不用model的就不用model,
返璞归真最好.
如果有人challenge或者不相信你的结果, 那
是另一回事, 你可以摆事实讲道理, 做各种
diagnostics和test说, 看这个model是如何如
何valid. 一旦此人信服, 就结束了. 把diagnostics
给程序化, 我总觉得和统计的基本理念相违背.

【在 q**j 的大作中提到】
: 如果你发现不完美的东西是由于某几个有问题的observatoin造成的,或者是由于
: heteroskysticity (sorry wrong spelling),而你把它们改正了,结果就变好了呢?

l******d
发帖数: 1633
10
en, 太cynical,outliers还是应该找的
我基本上就看看summery statistics,data没啥错就行了
normality check一般懒得弄,查出不是normal的不是白做了,嘿嘿

呢?

【在 s*****n 的大作中提到】
: 当然这种情况是有的, 不过绝大多数情况,
: 即使发现outliers也不好轻易改正吧.
: 毕竟data是真实的, model是假设的.
: 当然可以换model, 比如改用robust reg
: 最后的结果, 还未必哪个更有意义呢.
: 考虑的问题越多, 其实引入的noise就越多,
: 往往也会把问题不必要的复杂化. 我是觉得
: 做统计, 能简单的就不要复杂, 能做一步的
: 就别做两步, 能不用model的就不用model,
: 返璞归真最好.

s*****n
发帖数: 2174
11
呵呵, 我就是这个意思. 现实中, 做diagnostics的
可能不少, 但是做了以后真有actionable plan的并不多.
大多数情况, 如果结果不好, 也就凑合了. 如果结果好
更能自圆其说一些而已.
基本上还是要把握大方向. 做出来以后, 首先看看model是不是有
实际意义. 实际意义清晰且有用的, 做不做diagnostic都无所谓.
实际意义模糊, 矛盾, 或者不可用的, 统计上再怎么valid, 也是
没用. 只有在模棱两可的情况下, diagnostic才能在一定程度上
support统计结果.

【在 l******d 的大作中提到】
: en, 太cynical,outliers还是应该找的
: 我基本上就看看summery statistics,data没啥错就行了
: normality check一般懒得弄,查出不是normal的不是白做了,嘿嘿
:
: 呢?

f***a
发帖数: 329
12
How to determine "首先看看model是不是有实际意义. 实际意义清晰且有用的"?
Thanks~ :D
s*****n
发帖数: 2174
13
这个就"全凭一张嘴"了, 呵呵.
其实就是根据实际的问题, 看看能不能解释了.
大多数模型在fit之前, 脑子里就有一些实际解释吧.

【在 f***a 的大作中提到】
: How to determine "首先看看model是不是有实际意义. 实际意义清晰且有用的"?
: Thanks~ :D

f***a
发帖数: 329
14
ohh~ :)

【在 s*****n 的大作中提到】
: 这个就"全凭一张嘴"了, 呵呵.
: 其实就是根据实际的问题, 看看能不能解释了.
: 大多数模型在fit之前, 脑子里就有一些实际解释吧.

1 (共1页)
进入Statistics版参与讨论
相关主题
diagnostic medicine 这个方向好找industry 的工作么求教, clinical trial中如何处理missing value 和outlier
outlier detections问一个technical question的回答方法
请问这个问题应该用什么方法解决请问R里面哪个MCMC(或者metropolis-hastings)的package里的proposal density可以用户定义的
about outlier identification请教一下大家想准备统计面试的题目,应该看什么资料呢〉?
问个outlier 和 sample size 的问题哈请教大家一个关于check normality的问题
建模过程中对于outlier的处理问题补充一点统计方面的面试经验 (转载)
做linear reg怎么去掉outlier?正态分布,请教!
问个SAS 基本问题,请大家帮忙。请教如何做normalization,找峰值
相关话题的讨论汇总
话题: model话题: 结果话题: 实际意义话题: normality