由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 批判孙经先的好文章
相关主题
彭劲秀:孙经先的“结论”不能令人信服 2013-10-06 18:33:52愚公你不懂,桑海、鳖精、少民地区都饿不死人
孙经先和曹树基关于“饿死三千万”的激烈辩论 (转载)回复shotgun1984关于1960出生率和死亡人数的质疑
第5次人口普查漏报率1.81% (转载)饿死三千万的唯一证据露馅了(转载)
看田雪原怎么修改生育率的2005年----2010年,少民人口竟然反倒减少了954万人!
孔和尚讲计生委歪曲了人口数据统计局:中国总人口为13.39亿人
“饿死三千万”不是事实,估计250万以下第六次全国人口普查证实我国现役军人共230万
你看看这个算三年饿死多少人理直气壮的立论不?人口普查耗资80亿元 1300万人没户口多数为超生
请人口学家不要玩“顾头不顾腚”的游戏 (转载)毛轮李成瑞的论文(中国统计局局长)
相关话题的讨论汇总
话题: 死亡话题: 孙经话题: 漏报话题: 死亡率话题: 人口
进入Military版参与讨论
1 (共1页)
o*****p
发帖数: 2977
1
这篇文章直接从数据和孙经先的分析方法批评。简单而言就是
1. 孙经先的关键性假设“死亡漏报”,和人口普查数据严重冲突,
2. 他选择的“1,在死亡漏报的年份里,漏报了多少死亡?2,这些漏报的死亡人数,
在哪一年一次性补回了?” 的数据,又是根据结果倒推的人为的选择,而如果根据他
的模型选择前一年或者后一年的数据,他的模型就完全不成立,
3. 而他选择的年份,和当时的政策是对不上的。根据他的理论,应该选择的正确的补
回年份,他的理论得到的数据会非常荒诞。
请注意 原文中的数据的表格都是图片,copy中都丢失了. 所以只留下文字,完整的原
文请看
http://www.zhihu.com/question/26111992
最近经常被引用的孙经先教授的关于大饥荒的人口论文是否正确?经济学专业研究者如
何看待他的文章?修改
比如:三年困难时期:“饿死三千万”的谣言
还有:孙经先:“饿死3600万”的重大谬误是怎样产生的?
望回答者有理有据,回答不相关的就不要在回答区刷存在感了,我们在问题评论区聊聊。
对于无关回答,欢迎大家猛烈点击没有帮助。
回答:chenqin,数据帝
江苏师范大学数学学院孙经先教授发表在《马克思主义研究》上的论文《关于我国20世
纪60年代人口变动问题的研究》以及发表在《经济纵横》上的论文《关于我国三年困难
时期的人口变动(1959-1961)》认为,中国在20世纪60年代初出现的人口异常变动是
由于重报户籍人口注销和补报死亡造成的。将当年死亡人数减去重报户籍人口注销以及
补报死亡之后,中国在1959到1961年的非正常死亡人数约为366万(其中大部分即为孙
经先教授所谓的“营养性死亡”,约250万),而非从上世纪八十年代以来学界所公认
的2000万到3000万之间。
孙经先的论文被一些人士奉为圭臬,且被多方引用,以期证明大跃进期间的3000万非正
常死亡为“谎言”。孙经先如何算出这250万营养性死亡呢?来看一看。
各年死亡率和“非正常死亡”的关系
假如一个国家每年的死亡率都在10‰左右,而在某一年突然上升至20‰,随后的年份又
回落到10‰。此时我们可以说,在死亡率上升至20‰的年份,一批本不会在该年度死亡
的人提前到该年死亡了,其规模为该年度国家总人口的10‰。这就是“非正常死亡”的
定义。在孙经先的论文中,和“非正常死亡”具有同样含义的词语是“超线性死亡”。
下表列出了国家统计局公布的从1949年到1965年的总人口、出生率、死亡率和净增长率
。这个死亡率数据于1980年最初被学界使用,它是由中国人民大学的刘铮教授在1980年
北京国际人口学会议上提供的。
上表中,在1959年到1961年,中国的人口死亡率从1954到1958年的11‰左右上升到25.4
‰,于1962年后又回到了10‰。
以一个“正常死亡率”为基准,将真实死亡率与之相减,可得“非正常死亡率”。若以
10‰为该年度正常死亡率基准,那么三年共多死亡24.26‰,合计1609万人。因此,在
排除了“人口少生”的情况下,我们就能计算出1600万的非正常死亡。这也是Coale(
1981)得到的结果。
同时我们也能发现,在这种计算方式下,“基准死亡率”的设置对结果的影响很大。当
基准死亡率被设置为12‰时,非正常死亡人数立刻下降到1211万人。大跃进期间的真实
死亡率,也对结果有同样大的影响。因此,找到准确的历年死亡率,是估计大跃进期间
非正常死亡人数的前提。
死亡率是如何调整的?得出了何种结论?
人口学家发现,统计局公布的出生率和死亡率数字并不准确,这一事实在1982年人口普
查数字公布后才被逐渐确认。许多学者发现,在大跃进期间出生的人口,出现了“越活
越多”的现象。例如,按照统计局出生率计算,1958年共出生人数2065万人;但1964年
普查的6岁人口为2039万人,6年的死亡率仅为1.3‰,和我国当时新生婴儿五年死亡率
在100‰以上的数据不吻合。根据1964年普查和1982年生育回顾调查反推后,可得1958
年实际出生人数应为2580万人。也就是说,出生人口被低报了近20%。
从1953年人口普查到1964年人口普查,中国人口从5.82亿增长到6.94亿,净增加了1.12
亿人口。如果承认这两次人口普查的准确性,那么在这11年间的出生人数减去死亡人数
必须等于1.12亿。因此,当出生人口被低报时,死亡人口也必须被低报,才能够保证出
生人口减去死亡人口等于1.12亿。
事实确实如此,Ashton等(1984)和Banister(1987)发现,按照57、63年的死亡表所
预测出来的死亡率数字,也要高于57、63当年统计局所公布的死亡数字。死亡率同样被
低报了。
Ashton等(1984)和Banister(1987)根据两次人口普查和两年度生命表,计算了被低
报的死亡数字。他们首先根据分年龄的普查数字,算出在1953到1964年之间一共低报了
多少出生人口与死亡人口,再假设统计局的死亡低报率在各年度基本相同,于是这些被
低报的死亡人口便被分配各个年份,每年的死亡人数便同比例上升。
根据这种方法,我们可以将统计局公布各年度死亡率重新调整,以使得1953年到1964年
的总死亡数字与两次普查所计算出的数字相同。在此基础上,这两篇文献重新计算了大
跃进期间中国的非正常死亡人数,约为2950万到3000万之间。
在这两篇文献之后,一批中国学者也开始使用不同的数据和调整的方法,对大跃进期间
的非正常死亡人数进行计算,如彭希哲、蒋正华、李成瑞、曹树基等。其原理,都是在
根据1964、1982年两次人口普查以及各类其他数据对统计局公布的死亡率进行调整,汇
总结果如下表:
我们可以简单地总结上表:如果直接使用统计局公布的死亡率而不进行任何调整,那么
可以算出大跃进中的非正常死亡约为1650万人;若使用分地区数据、普查数据或者生育
回顾调查进行死亡率调整后,可算出非正常死亡在1700万到3250万之间不等。
孙经先的计算为什么是错的?
孙经先声称发现了在1953到1964年的死亡登记少于真实死亡的现象,并以此作为其论文
的卖点。但从前文我们可以发现,这个死亡漏登的现象早在30年前就已经发现,并已经
使用各种方法进行了调整。在孙经先的论文中,他认为自己找到了以上所有研究的种种
疏漏,并提出了自己的调整方法。按照他的调整方法重新调整死亡率之后,中国在大跃
进期间的非正常死亡人数下降为366万人,其中“营养性死亡”约为250万人。
我们不妨来看看,为何孙的调整方式会造成和其他研究如此大的区别?先看他的关键假
设:
死亡漏登的现象,在1953到1964年之间并不是普遍、平均出现的,而是在一些年份出现
了死亡漏登,在另一些年份进行死亡补登。根据发表在《经济纵横》上的论文《关于我
国三年困难时期的人口变动(1959-1961)》,1954到1958年,是死亡漏登的年份,期
间共漏登了750万人的死亡。在这些年份漏登的死亡,会在1959到1961年补登675万人。
也就是说,大跃进期的真实死亡率其实并不算高,统计数字报告的高死亡率,是因为大
量死亡补报正好发生在大跃进期间所造成的。
这个假设看上去在逻辑上并不离谱。但仅仅是在逻辑上不离谱而已。
从孙经先的这个假设,可以得出的一个直接结论就是:从1953年到1964年,虽然在某些
年份出现了死亡漏登,但是在大跃进期间这些漏登的死亡被补登了。因此,从1953年到
1964年并没有出现整体性的死亡漏登。据此推论,孙经先调整了历年的死亡人数,列表
如下(《关于我国三年困难时期的人口变动(1959-1961)》,表9):
黑色框部分,是经过孙经先调整后的死亡人数。对黑色框部分做一个简单的加总可以发
现,在孙经先的假设下,从1954年到1964年中国一共死亡9365万人。
那么事实如何呢?1953年,全国第一次人口普查统计出的中国总人数为5.826亿人。
1964年,上升到了6.946亿人,见下表。(中国统计年鉴,2011)
在1953年的5.826亿人,其年龄区间是0岁以上。这批人如果活到了1964年,就成了1964
年的11岁及以上人口。从1964年的6.946亿人里减去0到10岁人口,就得到了1953年的人
口在1964年的存活人数。
上表来自《中国人口统计年鉴》(1988)的400页。在这张表中,0到10岁的人口(黑框
部分)共有2.135亿人,他们在1953年之后才出生。从6.946亿总人口里减去这部分人,
可以算出4.811亿人,即1953年的人口到了1964年时的存活人数。将5.826减去4.811,
可以算出那些在1953年时就已经存活的人口,在1953到1964年之间,共死亡了1.015亿
人。这个数字就已经高于孙经先的估算值。
这只是死亡人口的一部分,接下来我们加入在1953到1964年之间出生的人口的死亡人数
。根据1957年生命表,一个新生儿活到10岁的概率为82.5%。也就是说,当我们在上表
中看到1964年的1921万10岁儿童时,能够推算出该年龄人口在出生时应当有2329万人。
有408万人已经在他们长大到10岁之前就死亡了。以此类推,把每个年龄段人口从出生
开始的死亡人数推算出来,可以算出1953年以后才出生的人口,在1953到1964年之间总
死亡人数为3529万人。必须注意到的是,为了计算1953到1964年间出生的新生儿死亡人
数,我们采用了死亡率较低的1957年生命表,而没有考虑大跃进期间大幅度提高的新生
儿死亡率。因此,这个数字仅仅是10岁以下儿童死亡数字的下限。
将两者相加,可以算出在1953年到1964年之间,死亡人数至少达到了1.368亿人。孙经
先算出的9365万总死亡人数,至少比人口普查数字的推算少了4318万人。
下图可以将整个计算过程看得更清楚:
换句话说,孙经先的假设从一开始就错了。他认为从1953到1964年之间的死亡率先漏登
后补登,且整体性的死亡漏报并没有发生,但事实上,这个假设将导致高达4318万人口
的死亡被他遗漏。这4000多万死亡人口,孙经先就这么给算丢了。
看到这里我们可能会产生这样的疑问:难道孙经先不知道他的假设和人口普查数字存在
这样大的矛盾吗?恰恰相反,他意识到了1964年的人口普查数字与他的假设相矛盾,因
此在文中有意漏掉了1964年普查的数字,写道:
我国在1953 年和1982年分别进行了第一次和第三次全国人口普查,这两次人口普查的
质量得到公认,为研究这期间的我国人口变动树立两个基准。
只剩两个基准了,仿佛1964年普查不存在似的。事实上,1964年的二普、1982年三普和
1990年四普都被人口学界公认为十分准确的普查,从1964年的普查数字来推算1982年的
人口,结果会拟合得非常好。孙经先选择性遗漏了1964年普查,那么他自己的计算,和
他本人所树立的“1982年基准”有没有矛盾呢?
根据孙经先的论文《关于我国三年困难时期的人口变动(1959-1961)》的表格9,1953
到1982年间共死亡了2.088亿人。而根据1953和1982年两次普查数据以及1975年死亡率
,可以画出和上图类似的表格:
使用1963年生命表来计算1953到1982年的出生人口的死亡情况,可以算出1982年的28岁
及以下人口从出生开始的总死亡人数为7267万人,29岁及以上人口死亡1.865亿人,死
亡总数达到了2.592亿人。同样,由于1963年死亡率并不高,我们算出的28岁以下人口
的死亡情况仍然是估计的下限。将区间扩大到1953到1982年,这个期间的死亡人数仍然
比孙经先的估计要高出5031万人。
如果说用63年生命表来估计53到82年间出生人口的总死亡情况仍然太过保守的话,那么
我们可以尝试采取一种更为极端的假设——所有在53到82年间出生的人都以81年死亡率
生存。这种假设下,一个50年代出生的孩子将享有80年代初的卫生医疗水平,从而使5
岁前的死亡率下降到了50年代的三分之一到四分之一,可以说是对儿童死亡人口估计的
下限中的下限了。但即便在这样激进的假设下,53到82年间出生的人口,在82年普查之
前仍然已经死亡了3905万人。加上53年前出生人口的死亡,仍然有2.255亿人,比孙经
先的计算高出1669万人。看来,在孙经先的计算中,那些53到82年间出生的人口的死亡
率比起21世纪的中国还要低。
孙经先的假设,不仅与1964年人口普查数据有着4318万人的死亡差额,就是与孙经先本
人奉为“基准”的1982年普查数据,仍然有超过5000万人的死亡差额。进行这么一个离
谱的假设,只是为了要减少1953年到1964年的整体死亡人数,方便自己缩小大跃进期间
的非正常死亡。真可谓藏头露尾,十分难看。
孙经先的论文还有哪些严重的学术道德问题?
既然已经证明了孙经先的论文建立在一个错误的假设上,那么我们是不是已经可以将它
扔进垃圾堆了呢?不,这不算完。孙经先的论文除了故意进行错误的假设之外,还存在
着其他严重的问题。
现在,不要理会其他错误,我们按照孙经先的思路走下去,看看究竟问题出在哪里。
回到其假设:一些年份出现了死亡漏报,而这这些漏报的死亡,又会一次性在某年补报
回来,从而造成该年度的死亡人数虚高。
为了计算去除死亡补报后的真实死亡人数,我们需要假设两个参数:
1,在死亡漏报的年份里,漏报了多少死亡?
2,这些漏报的死亡人数,在哪一年一次性补回了?
在不同的参数假设下,我们可以算出下表:
表格 1:按照漏报程度与补报年份排列的补报年度真实死亡率和大跃进期间非正常死亡
人数[1]
上表中,横坐标为死亡漏报的程度,纵坐标为漏报死亡一次性补报的年度。每一个格子
包含两个信息,分别为死亡补报年度的真实死亡率,和1959-1961年间的非正常死亡人
数(以调整后的1957年死亡率为“基准死亡率”)。[2]
在上表中不难看出,随着两组参数的变化,补报年度的真实死亡率和大跃进期间的非正
常死亡人数变化非常巨大。参数稍稍变动,便会得到迥然不同的结果。
站在孙经先的角度来思考,我们在表中发现,为了同时达到两个目的:1,尽量压低非
正常死亡人数,2,不要让补报死亡年份的真实死亡率低得太过离谱,那么可选择的参
数区间并不大。
首先,必须排除真实死亡率低于10‰的参数——否则,补报年份的真实死亡率看起来就
太低了。此时,表格最右边的部分不能选择,因为如果漏报太多,一次性补报也就越多
,那么在补报年度就会有更多的死亡数字来自死亡补报,余下的真实死亡反而会降得过
低。那么,只能选择黄色部分的格子。
其次,排除非正常死亡总数远高于500万的格子——否则,非正常死亡太高,本文的目
的就无法达到。那么,只能选择蓝色的格子。
因此,孙经先要达到自己的目的,只能选择两个条件都满足的绿色的格子,即死亡漏报
在12%到20%之间,同时在1960年一次性补报。
孙经先的确是这么做的。在《关于我国20世纪60年代人口变动问题的研究》一文中,他
假设54到58年每年死亡率漏报了12%,这些漏报的死亡人口在1960年一次性补报。
让我们继续站在孙经先的角度上思考。如果我在撰写一篇正常的学术论文,那么在这样
一个对参数十分敏感的模型中,就必须要找到十分确凿的证据,以说明所使用的参数的
确符合现实。如果证据比较弱,或不支持一个特定的数字,那么我就必须在一个区间内
测试模型结果,来说明虽然证据不足但结果仍然稳健。
来看看孙经先为他选择的两个参数找到的证据。
随着1958 年《中华人民共和国户口登记条例》的发布和真正落实(这一条例的真正落
实是在1960 年前后),这些漏报死亡人口的户籍在1960 年前后被注销,就是一件自然
的事情。
——《关于我国20世纪60年代人口变动问题的研究》
1958年1月,经全国人大常委会通过,并以中华人民共和国主席令的形式发布《中华人
民共和国户口登记条例》,我国户籍管理制度才在法律意义上建立起来了……由于要进
行准备,并且由于“大跃进”运动的发动,《户口登记条例》的实施被推迟了。这个条
例的正式实施是在1959年下半年的秋天到1960年、1961年。
——《统计与政治(研讨会记录稿)》
《户口登记条例》实际上是三年困难时期才在全国范围内实施的,由于这一条例的实施
,死亡漏报的情况也应有大幅度减少,事实证明了这一点。
——《关于我国三年困难时期的人口变动(1959-1961)》
真是让人目瞪口呆的“确凿”证据。
第一,在前两篇文献中,1958年出台的条例和死亡补报到底有什么关系?文中并未进行
任何说明,只是假定在该条例出台前“相当数量的人口已经死亡但没有及时进行死亡登
记”而出台后漏登死亡被注销。实际上,根据1964年生命表可以发现,死亡漏报一直到
1964年仍然在持续,在1975年也没有停止。该条例的出台与否,和从死亡漏报到一个子
虚乌有的“死亡补报”的转变,没有任何关系。
第二,为什么条例在1958年出台,却没有选择1958年作为死亡补报的年份,而非要选择
1960年呢?又是要准备,又是要发动大跃进,生拉硬拽地把一个1958年的条例拉到1960
年生效,仅仅为了避免表1中第一行的情况出现(非正常死亡人数始终高于800万)。
第三篇文献,更是完全不用证据了,用上了套套逻辑——根据假设算出了“事实”,再
根据“事实”说明假设是正确的。
按照这种随意的解释,为什么孙经先不以“1960年的大跃进正如火如荼”为理由再把条
例生效日期推迟一年,到1961年再进行死亡补报呢?看看表1就明白了——此时1961年
的真实死亡率会被降得太低,“看起来不合理”了。
再来看第二个参数的证据。孙经先将1954到1958年死亡漏报率被设置为12%,凭什么?
我们把1954-1958 年期间死亡漏报率暂定为12%,这是保守的估计(按照科尔和蒋正华
先生的估计,这一期间的死亡漏报率高达40%以上)。如果我们把这一期间死亡漏报率
由12%继续向上调整(我们倾向于这样做),则1959-1961 年期间的死亡率就要继续下
调。
——《关于我国20世纪60年代人口变动问题的研究》
事实上,上述1953年和1957年两次抽样调查的结果表明我国这一期间的死亡漏报率为16
%—18%,充分说明了“我们把1954—1958年期间死亡漏报率暂定为12%,这是保守的估
计”这一说法是谨慎的、留有余地的,也是无可非议的。
——驳洪振快《有关大饥荒的新谬说》
1958年1月颁布《户口登记条例》,可以认为这一年死亡漏报率应有所下降。假定其为
1957 年的一半。
——《关于我国三年困难时期的人口变动(1959-1961)》
又是一个令人叹服的“证据”。在第一篇文献中,既然在Coale和蒋正华的估计中死亡
漏报达到40%,且孙经先也“倾向于”将死亡漏报调高,何不从40%开始,计算在一系列
参数影响下的非正常死亡人数呢?为何要“暂定”为一个没头没脑没根据的12%?
很简单,在死亡漏报提高到24%时,大跃进期间就不仅没有非正常死亡,还反过来比其
他年份少死亡200万人,1960年死亡率也降低到8.38‰——这实在是太反常了,太“不
合理”了。
在孙经先最近对洪振快的反驳中,他又声称他已经为这个没头没脑的12%在事后找到了
证据。但稍一检查,我们就能发现这个说法的问题:既然事后找到了16%到18%的漏报率
,那么按照孙经先的模型,将12%改成18%,结果会如何呢?
在孙的论文《关于我国20世纪60年代人口变动问题的研究》中,根据12%的死亡漏报率
,可以算出从1954到1958年漏报了505万死亡人口。如果死亡漏报率上调至18%,死亡漏
报人数立刻上升50%,至757万人。在这种情况下,从1959到1961年需要进一步扣除的补
报死亡人数,又多了252万人。这么一扣除,连孙经先自己算出的250万“营养性死亡”
人口,都完全被扣光了——数字一改,大跃进期间的非正常死亡就完全消失了!
孙经先当然没有这么做,为了保证其结果看起来合理,孙经先在之前文献支持40%漏报
率,在1953和1957生命表支持16%到18%漏报率的情况下,选择了一个毫无根据的12%作
为其第二个参数。[3]
既有一点非正常死亡,又不至于太多,12%可真是一个刚刚好的数字呢。
在第三篇文献中,既然之前已经假设《户口登记条例》在1960年才会施行,为何它又对
1958年的死亡漏登率有影响?既然在这里假设《户口登记条例》已经部分起作用并使使
1958年的死亡漏登率减半,为何前文又要假定漏报的死亡完全不能在1958年补报,非要
一个不少地拖到1960年才能补报?设置参数的“证据”完全自相矛盾,讲到哪里是哪里
,根本无法想象这是一个数学教授的手笔。
虽然没有证据,孙经先也不打算给出任何稳健性检验,来说明参数变动对结果的影响大
小。例如,为什么要在1960年补报而不是1959或1961?为什么漏报了12%而不是8%或者
16%?如果选择其他的参数会有什么结果?既然没有扎实证据,那么不同参数给出的结
果稳健吗?这一系列问题,一个也没有得到回答。只有“因为所以,科学道理”一样的
逻辑。当然,看看表1,我们就能理解孙经先的“煞费苦心”——一旦做了参数检验,
反而就更需要证据来证明参数的准确性了。
在这里,孙经先的潜台词已经呼之欲出是:要得到我想要的结果,只能选择这样的参数
,自然不可能找到对应证据。
让我解释得更清楚一些。在一篇正常的学术论文中,可能会先有一系列假设,然后在假
设上建立模型,而后根据一些证据设置合适的参数,最后模拟出可能的结果。
而孙经先的论文,首先在一个错误的假设上建立了错误的死亡漏报补报的模型,以致于
和两次人口普查出现了四千万到五千万人口的差额。而且,这篇论文并没有找到任何证
据来决定其参数的大小,尽管其模型对其参数非常敏感。相反的,孙经先首先确定了看
起来最“合理”的结果,然后反过来凑了两个数字,再装模作样地提出了一系列“套套
逻辑证据”。事实上,就连孙经先自己提出的250万“营养性死亡”,也会在孙经先一
个参数的改动下,完全消失。
使用孙经先的“模型”,使用同等分量的“证据”,我们可以给大跃进期间的非正常死
亡人数赋予任何数字,不仅可以算出250万,也可以算出5000万以上甚至零以下的数字
。这样的“论文”,却能够得到一批人的支持,真是让人感到不可思议。
孙经先的行为属于什么性质呢?
Misrepresent speculations as fact. 将猜测曲解为事实
——Panel on Scientific Responsibility and the Conduct of Research
这是学术欺诈,属于学术不端的一种。而且孙经先的欺诈行为,相当严重。
对孙经先的这一系列行为,我的建议是:
1,将孙经先发表在《马克思主义研究》和《经济纵横》上的两篇相关论文撤稿。同时
,相关编审人员也需要检讨:为何这样一篇带有欺诈性质的「学术论文」能够被刊登?
2,审查孙经先教授至今发表的所有论文是否有类似的欺诈行为。
对那些被孙经先的论文蒙蔽的人,我的建议是,提高自身水平,防止再度上当受骗。
而对另外一些明知孙经先的学术欺诈,却仍为其摇旗呐喊的人,我无话可说。
[1] 该表格的模拟与孙经先论文中的模拟有些许不同,可能导致非正常死亡总数产生一
些差异。
[2]死亡补报年度的真实死亡率计算:首先计算在该漏报程度下之前年份的总漏报,再
将该年度报告死亡人数减去总漏报死亡人数,最后除以当年人口。因此,当漏报越严重
时,在死亡一次性补报的年度,用总死亡减去死亡补报后得到的真实死亡率越低。大跃
进期间的非正常死亡人数计算:使用了之前算出的历年死亡率,减去1957年基准死亡率
后,分别乘以当年人口,最后加总。
[3] 孙经先在《经济纵横》上的论文试图寻找死亡漏登的证据。他根据57年生命表,算
出当年死亡率被低估16.34%。但根据63年生命表与75年生命表,1963年死亡人口仍然漏
登了6.9%,1975年死亡人口漏登了9.7%;而孙经先为了证明1960年后就没有死亡漏登,
选择性地只引用了1957生命表,并将1963的算出的漏登率篡改为3.28%,这属于更加恶
劣的篡改数据行为。
后记:
许多人读过我年初写的这篇文章(苍蝇不打不会自己死掉 - Clean Data - 知乎专栏)
,他们虽然能感到孙经先的方法有问题,但可能并没有意识到这并不是「有问题、出了
错」那么简单。
孙经先是沿着「先确定想要的结果——故意扯一个错误的模型——凑两个合意的参数—
—挑选部分证据而隐藏其他数据」这样一条畸形的路径进行研究的。他的整个论文,都
在进行各种各样的数据筛选,例如使用64年普查的死亡率,但是就是把64普查的总人口
藏起来,只是因为前者支持他的假设而后者不支持;用了57年生命表来证明死亡漏报,
却选择性无视63生命表和75生命表仍然支持死亡漏报,虽然他们在其所引用的年鉴上仅
有一页之隔;引用其他作者的数据,对两行相隔的数据只用其一,另一个不支持自己的
数据就当作没看见。这完全是按照蓄意欺骗的节奏在写「论文」。
我很后悔,说着要打苍蝇,却天真的以为孙经先只是把自己绕进去了,因此没有下狠手
,导致越来越多人被蒙蔽,甚至开始怀疑大饥荒是否存在,以至于今天要写第三篇关于
大饥荒的答案。第一篇在这里(知乎 - 与世界分享你的知识、经验和见解)
直到今天,我读了孙经先所引用的所有材料,才发现并非如此,他不是把自己绕进去了
,他是在明明知道自己做错了的同时,继续这么写。学术不端这顶帽子,不是我硬要送
给他,而是孙经先当之无愧。
真的真的希望,不要再让我有机会写第四篇了。
o*****p
发帖数: 2977
2
以后毛轮再祭出孙经先的这篇文章,直接用知乎这篇砸回去就可以了。数据详实,反
驳充分。

【在 o*****p 的大作中提到】
: 这篇文章直接从数据和孙经先的分析方法批评。简单而言就是
: 1. 孙经先的关键性假设“死亡漏报”,和人口普查数据严重冲突,
: 2. 他选择的“1,在死亡漏报的年份里,漏报了多少死亡?2,这些漏报的死亡人数,
: 在哪一年一次性补回了?” 的数据,又是根据结果倒推的人为的选择,而如果根据他
: 的模型选择前一年或者后一年的数据,他的模型就完全不成立,
: 3. 而他选择的年份,和当时的政策是对不上的。根据他的理论,应该选择的正确的补
: 回年份,他的理论得到的数据会非常荒诞。
: 请注意 原文中的数据的表格都是图片,copy中都丢失了. 所以只留下文字,完整的原
: 文请看
: http://www.zhihu.com/question/26111992

o*****p
发帖数: 2977
3
这篇文章的简化版在这里,
http://zhuanlan.zhihu.com/chenqin/19673836
就是孙经先专门选了一个年份作为基准来“填平”死亡率,如果选前一年或后一年,
他的模型就会有荒诞的结论。

【在 o*****p 的大作中提到】
: 这篇文章直接从数据和孙经先的分析方法批评。简单而言就是
: 1. 孙经先的关键性假设“死亡漏报”,和人口普查数据严重冲突,
: 2. 他选择的“1,在死亡漏报的年份里,漏报了多少死亡?2,这些漏报的死亡人数,
: 在哪一年一次性补回了?” 的数据,又是根据结果倒推的人为的选择,而如果根据他
: 的模型选择前一年或者后一年的数据,他的模型就完全不成立,
: 3. 而他选择的年份,和当时的政策是对不上的。根据他的理论,应该选择的正确的补
: 回年份,他的理论得到的数据会非常荒诞。
: 请注意 原文中的数据的表格都是图片,copy中都丢失了. 所以只留下文字,完整的原
: 文请看
: http://www.zhihu.com/question/26111992

h***f
发帖数: 4541
4
统计数字都是户籍数字,这是统计局局长李成瑞公开承认的。孙经先的结论也是基于当
年的户籍资料。重复报户口、死亡漏报也都是事实并且有大量实例为证(例如,仅仅在
我们那个县,和我父亲一起漏报户口的至少有5万人,还不包括他们的子女)。最后,
孙经先也没说过什么“添平”,而是说原来的天文数字是毫无依据的胡说八道。如果我
没记错,他估计的非正常死亡数字是三四百万。
作者无论对原始资料的理解还是掌握,都不如孙经先,除了领美分以外,实在没有多大
价值。
o*****p
发帖数: 2977
5
up

【在 o*****p 的大作中提到】
: 这篇文章直接从数据和孙经先的分析方法批评。简单而言就是
: 1. 孙经先的关键性假设“死亡漏报”,和人口普查数据严重冲突,
: 2. 他选择的“1,在死亡漏报的年份里,漏报了多少死亡?2,这些漏报的死亡人数,
: 在哪一年一次性补回了?” 的数据,又是根据结果倒推的人为的选择,而如果根据他
: 的模型选择前一年或者后一年的数据,他的模型就完全不成立,
: 3. 而他选择的年份,和当时的政策是对不上的。根据他的理论,应该选择的正确的补
: 回年份,他的理论得到的数据会非常荒诞。
: 请注意 原文中的数据的表格都是图片,copy中都丢失了. 所以只留下文字,完整的原
: 文请看
: http://www.zhihu.com/question/26111992

o*****p
发帖数: 2977
6
Up

【在 o*****p 的大作中提到】
: 这篇文章直接从数据和孙经先的分析方法批评。简单而言就是
: 1. 孙经先的关键性假设“死亡漏报”,和人口普查数据严重冲突,
: 2. 他选择的“1,在死亡漏报的年份里,漏报了多少死亡?2,这些漏报的死亡人数,
: 在哪一年一次性补回了?” 的数据,又是根据结果倒推的人为的选择,而如果根据他
: 的模型选择前一年或者后一年的数据,他的模型就完全不成立,
: 3. 而他选择的年份,和当时的政策是对不上的。根据他的理论,应该选择的正确的补
: 回年份,他的理论得到的数据会非常荒诞。
: 请注意 原文中的数据的表格都是图片,copy中都丢失了. 所以只留下文字,完整的原
: 文请看
: http://www.zhihu.com/question/26111992

1 (共1页)
进入Military版参与讨论
相关主题
毛轮李成瑞的论文(中国统计局局长)孔和尚讲计生委歪曲了人口数据
“大跃进”引起的人口变动-----李成瑞 (国家统计局原局长)“饿死三千万”不是事实,估计250万以下
这些年灌水的小结, 细节请看我blog你看看这个算三年饿死多少人理直气壮的立论不?
“大跃进”引起的人口变动 by李成瑞请人口学家不要玩“顾头不顾腚”的游戏 (转载)
彭劲秀:孙经先的“结论”不能令人信服 2013-10-06 18:33:52愚公你不懂,桑海、鳖精、少民地区都饿不死人
孙经先和曹树基关于“饿死三千万”的激烈辩论 (转载)回复shotgun1984关于1960出生率和死亡人数的质疑
第5次人口普查漏报率1.81% (转载)饿死三千万的唯一证据露馅了(转载)
看田雪原怎么修改生育率的2005年----2010年,少民人口竟然反倒减少了954万人!
相关话题的讨论汇总
话题: 死亡话题: 孙经话题: 漏报话题: 死亡率话题: 人口