s**********y 发帖数: 38 | 1 I'd like to know the agreement of 1st rating and 2nd rating.
the p value of McNemar's Test is 0.0455, but the Kappa is 0.6602.
How should I explain? Thanks.
Kappa is 0.66. Does that mean moderate agreement? Should I only use kappa in stead of McNemar's Test to explain agreement? Thanks.
1st rating 2nd rating
Frequency N Y Total
N 67 12 79
Y 4 26 30
Total 71 38 109
Frequency Missing = 134
McNemar's Test
Statistic (S) 4.0000
DF 1
Pr > S... 阅读全帖 |
|
p********6 发帖数: 1339 | 2 T-test is to compare means of a continuous variable in two groups.
What you want to compare are the proportions (of treatment A and B) so t-
test is not appropriate. The test you want to use is McNemar's test. Search
McNemar's test and stratified McNemar's test to get more details. |
|
s**********y 发帖数: 38 | 3 McNemar's null hypothesis is
The null hypothesis of marginal homogeneity states that the two marginal
probabilities for each outcome are the same
for one variable: p value of McNemar's=0.2, which means the two ratings are
the same. But the kappa is 0.1966, which is poor agreement.
Isn't this conflict?
Hope someone can help me with this. |
|
w*******9 发帖数: 1433 | 4 Does Mcnemar test really test independence? Many people say when the data is
paired use Mcnemar test; otherwise choose Pearson or Fisher exact test. For
example http://yatani.jp/HCIstats/ChiSquare
What do they mean by "paired data"? Any discussion is welcome. |
|
n*****n 发帖数: 3123 | 5 左眼和右眼
survey 小孩的情况
父亲的答案和母亲的答案
google Mcnemar test
看个例子就清楚了
mcnemar测的不是independence. 测的是proportion是否一样 |
|
a*******g 发帖数: 80 | 6 谢谢回复。是两个平行的diagnosis。同意你的意见一 其实sensitivity 和
specificity 是看不同方面 这个我们文章中也有讨论 但是医生还是希望statistician
告诉说综合看那个好
还有你说得这个test 就是mcnemar test还是另外一个test? 我也常常跟着读音拼错这
些名
突然想到一个办法 把病人重新code成TP,TN,FN,FP,然后把两种诊断的新data用
mcnemar test 是不是可行呢? |
|
s*****0 发帖数: 357 | 7 周末杂事比较多,小孩的playdate,还有和朋友约定的网战等等,未能及时更新,见谅。
感谢楼上hbsr2010的一些概念更正,平时理论接触的少了,记忆有偏差,因为在网上随
便写些,也懒得查书,写的时候随兴所至,没有太注意。我尽量让文笔轻快些,让读者
不至于厌烦。以后尽量会避免误导,如有不确实之处,请务必指正。先行谢过了,因为
有自己的一摊东西要收拾,不能像做科研那样严谨了。
前文提到的t test, one way ANOVA以及相关的nonparametric都只有涉及到一个
variable,比如作对照实验,variable即treatment type,不同计量药物或者是
placebo。组和组的区分是由这个variable决定的。在涉及到更为复杂的模型前(比如
two way ANOVA, multiple regression),我觉得还是先唠叨唠叨categorical data的
统计方法,毕竟做multiple regression之类的工作需要一定的统计背景,平时远没有
Chi-square这样的test用得多。所以先简后难了。
Categorical data在生... 阅读全帖 |
|
q****k 发帖数: 1023 | 8 把每组的样本量也标上(在x-axis),有些帮助。
两组数据是来自独立的不同小鼠么?如果是, Chi-squared, 或者Fisher‘s Exact
Test。
如果两组数据是相干的(这种情况也是有可能的),也即同一个小鼠产生a组的数据,
也产生b组的数据, McNemar's test.
b |
|
|
|
|
s*r 发帖数: 2757 | 11 check agresti's book
it seems the author does not suggest mcnemar's test can be extended to 3 by
3 table, instead logistic regression for correlated response was suggested |
|
s*r 发帖数: 2757 | 12 this feels like mcnemar |
|
T*******I 发帖数: 5138 | 13 我google了一下McNemar,发现就是我在国内学过的配对四格表(2X2 contingency
tables)的卡方检验。然而,这里的问题中并没有四格表的数据结构,而是仅有两种相
互关联的方法的阳性结果,其试验设计和结果都不满足配对卡方检验所要求的条件。 |
|
b*******r 发帖数: 152 | 14 this is a standard matched pairs data - use mcnemar's test. proc freq; table
.../AGREE; |
|
Y******Y 发帖数: 8753 | 15 McNemar's Test for matched pair |
|
s****i 发帖数: 197 | 16 小弟目前是一二流大学在读stat phd 刚刚成为phd candidate不久, 老板是做
classification
方向的, 最近正在拉合作 搞到一套数据 让我用classification (主要是random
forest, SVM
boosting这些啦)去套 希望看到的是用classification方法做出来的预测比用
multinomial
logistic regression做出来的准确 但是小弟用R的package改parameter无论如何也做
不出这效
果啊 即使用binomial的都是logistic比class的强 multi的logistic就更准了 每次见
老板都被
一顿臭骂 唉~ 请问各位大大该怎样改 用何种方法或者model才能提高classification
方法的准确
率啊 再次先谢谢众位大大了!!
==============更新==================
先谢谢 楼下几位大大的回答 这个问题是说的有点模糊 这套数据的response是一个
ordinal variable (0 1 2 3 4 5 五级 越大越显著 0表示没有... 阅读全帖 |
|
m******u 发帖数: 277 | 17 How about McNemar test?
You can get it from PROC FREQ~ |
|
n*****n 发帖数: 3123 | 18 kappa or mcnemar
kappa应该更合适些 |
|
|
y*****w 发帖数: 1350 | 20 Not necessarily matching. Could be propensity score weighting (IPTW). Often
times weighting is better than matching, because (1) by matching, you are
gonna lose quite a lot subjects, and (2) with the matched data, you have to
take into account its paired nature when conducting analysis, such as using
paired t-test or McNemar test, and sometimes it would be hard to perform
such analysis, for example it's hard to find a counterpart of mixed model
under the paired nature of the matched data. |
|
b******2 发帖数: 654 | 21 两个group,用propensity score matching得到 500 病人, 1000个健康人, 应该用什
么test 比较matched group的 continuous and binary outcomes?
1:1 propensity score matching will need to use paired t-test/signed rank
test for continuous, McNemar for binary outcome.对1:2 matched , 好像不能用
。 谢谢! |
|
a*******g 发帖数: 80 | 22 最近课题
1要评估诊断方法,我计算了sensitivity 和 specificity,有没有什么staistics 可
以综合评估这个诊断方法 比如把这两个%加起来 感觉有点扯啊
2 我们想比较这个诊断方法在不同病人身上的表现 我打算计算每个小组的
sensitivity 和 specificity 然后分别有chisq检验 可以吧 因为各小组病人不重叠(
比如 男病人和女病人) 满足indenpendent原则 但是如果病人在不同小组有重叠该怎么
检验呢 比如胖的病人和男的病人 其中必然有些男胖病人 该怎么办
2如果比较不同的诊断方法 1和2 病人都是同一群 该用什么检验方法 mcnemar 比较
paired data 但和这个没关呀
听听大拿们的建议
多谢! |
|
t*****a 发帖数: 459 | 23 嗯对,就是mcnemar,前面拼写错了。
和医生吧,我觉得不能他们要什么就给他们什么,要跟他们讲道理。实在讲不过,把他
们要的东西给了,也得把这个东西的局限性反复说清楚。不过统计师和医生的交流难度
好像是个永恒的问题 :-p
关于诊断这个,和医生的一个交流办法是,问他们,愿意用多少个false positive换多
一个true positive。比如癌症,如果要开刀诊断,有的情况下医生就会觉得,白开30
个病人得到1个true positive他们就很满意。如果手术伤害很大的情况,可能医生就会
觉得,白开10个病人得到1个true positive他们就会满意。这样再换算出一个评价
specificity和sensitivity的公式来。 |
|
t*****a 发帖数: 459 | 24 mcnemar那个操作很简单,就是sensitivity只用disease positive的病人,
specificity只用disease negative的病人,都不是用全体。 |
|
g**a 发帖数: 2129 | 25 这个就是alpha和beta啊。McNemar的NULL是 two marginal probability for each
outcome are the same. Pb=Pc. 这个对楼主需要的结论没有帮助吧?reject以后结论
是什么?Pb<>Pc? 这没用吧?确实需要根据医生的实际要求把这两个值和起来。 |
|