第2页 - 关于数据误差的讨论汇总 - 话题女王

全部话题 - 话题: 数据误差

l****t
发帖数: 1580

1 L.James 得分+篮板+助攻总数（允许误差1)
2 D.Wade 得分+篮板+助攻总数（允许误差1)
3 K.Durant 得分+篮板+助攻总数（允许误差1)
4 R.Westbrook 得分+篮板+助攻总数（允许误差1)
每答对一题一个包子
常驻id奖励加倍（以在本版发文大于200为标准）

l******n
发帖数: 5273

来自主题: NBA版 - 【有奖竞猜】Game 2 MIA@OKC 数据

1 L.James 得分+篮板+助攻总数（允许误差1) 48
2 D.Wade 得分+篮板+助攻总数（允许误差1) 28
3 K.Durant 得分+篮板+助攻总数（允许误差1) 44
4 R.Westbrook 得分+篮板+助攻总数（允许误差1) 37

c***s
发帖数: 70028

来自主题: Headline版 - 北京环保局首度公布数据称PM2.5值呈下降趋势(组图)

1月6日，北京市环保局首次公布了过去十年来北京市PM2.5（空气中直径小于或等于2.5微米的固体颗粒或液滴的总称）浓度趋势的研究性结果，按照科研文献，过去十年本市PM2.5年均浓度呈下降趋势，不过，按照即将颁布的新国标，2010年的年均值仍然超标一倍。
1月4日，北京，中国环境监测总站大气室的工作人员正在对细粒子PM2.5连续检测仪的切割头进行校验。邓佳摄
PM2.5浓度十年下降约1/3
前日，市委书记刘淇与环保部部长周生贤进行座谈，刘淇表示北京将“打一场提升空气质量的攻坚战”，同日，市环保局宣布将在春节前公布本市PM2.5的研究性数据。昨晚，市环保局首次公布了从科研论文中得出的北京过去十年的PM2.5趋势。这是北京首次由官方公布PM2.5过去十年趋势的研究性数据。
环保局介绍，虽然十年前北京暂未开展常规性监测，但根据PM2.5的相关研究文献表明，北京市2000年PM2.5年均浓度约为100-110微克/立方米，到2005年，降低到80-90微克/立方米，2010年达到70-80微克/立方米。“10多年来，PM2.5呈下降趋势。”市环保局称。
发达国家污染问题在京集中显现
不过，根据... 阅读全帖

o***s
发帖数: 42149

来自主题: Headline版 - “人在证途”的无奈：“奇葩证明”证明了什么？

在搜索引擎中输入“奇葩证明”，上百万的查询结果俨然是一部现代版的《笑林广记》，然而这些让人啼笑皆非的“天大笑话”，发生在自己身上就着实让人欲哭无泪。
日前，湖北省恩施土家族苗族自治州一位准备出国打工的男子就遭遇了这样的“欲哭无泪”。他需要办理的各种手续中，包括一项出生证明公证，而办理该公证，需要提供父母的结婚证。该男子母亲已年过七旬，父亲亡故，结婚证早已遗失。
为此，该男子跑了一星期，花费几千元，公证依然没有办好。媒体报道后，恩施清江公证处凭其提供的所在村证明、档案局的人口普查底页，为该男子办理了公证。
证明过滥过繁，折射政府审批事项依然过多，表明一些地方基层政府和部门在管理和服务中确实存在不规范、不透明、不作为问题，也说明职能部门存在信息壁垒。
最近，国务院有关部门针对社会反映强烈的“证明多”“证明繁”问题，研究制订系列简政放权措施，力图解决类似“你妈是你妈”的荒唐证明问题，为群众服务，方便群众办事。
信息化为现代社会治理提供了便利，本来可以让数据跑路的事情，为何要让群众劳苦奔波？“奇葩证明”何以泛滥？何时能休？
不必要、没法办、必要而又不好办
“人在证途”的无奈
“残联发的残疾人证... 阅读全帖

发帖数: 1

来自主题: Military版 - 中美经济对比中的数据问题及未来展望

1，中美经济实际体量与GDP数据严重背离的问题。
中美经济实际体量对比有传统的工农业产值对比、购买力平价GDP对比、汇价GDP对比。
工农业产值对比由于统计方法不具有现实国际通行性，虽然直接客观，但一旦用之于国
际比较，就存在计算标准统一上的难题，最后往往变成具体的工农业产品产量比较。
由于中国资本市场尚未全放开开放，汇价GDP对比就不免显得偏离实际，数据存疑存议。
购买力平价相对客观，但同样存在诸多异议。它并非各国通行的正常数据统计，只是某
些国际机构按一定权重参数用数学方法对汇率GDP数据加以调整修正。
此外，各国数据统计规则、内容项目的差异，统计数据的及时有效真实性等等，都存在
现实差距。各种市场主体操控方因利益博弈、各国政府相关经济机构因为政治考量、一
些国际统计机构信用评级机构出于商业利益考量对于数据的人为干预，也是不容忽视的
现实。
经济数据不能反应真实经济状况已越来越成为各国普遍现象，已大大超越正常误差范畴
，日益由经济决策重要参考工具蜕变成为市场干预、利益博弈工具。真实性与参考价值
日益降低。
目前中美两国经济实际情形与GDP数据对比已表现出偏离显著过多的状况。
这种数... 阅读全帖

发帖数: 1

来自主题: Military2版 - 最新更新俄罗斯弹道导弹核潜艇近况。

根据俄罗斯GDP增长率和俄罗斯弹道导弹潜艇战备值班变动率做的图表，能看出正相关
对应关系。
2013年之后根据这个正相关与GDP对应关系，下面是估计的俄罗斯潜艇战备值班巡航数：
2013年5次，2014和2015年3次，2016年2次。
当然了，这个数字是估测的，误差比较大，要等美国和俄罗斯那边出数据才能看看数据
误差有多大。
我们按照俄罗斯2011-12年一年5次的战备巡航次数来说明俄罗斯的海基核威慑和核反击
能力。
俄罗斯的潜艇战备区离港口比较近，那么值班时间大概是40-60天，2个月不到，这个数
字比起美国为少。
我们按平均50天来算，2012年俄罗斯现役5艘667BDRM德尔塔Ⅳ和3艘667BDR德尔塔Ⅲ，
那么就是8艘核潜艇只有5艘一年出港值班一次，其余3艘核潜艇在家宅了一年。
理论上要5次战备巡航就覆盖一整年，也就是说一年任何时间都要至少1艘核潜艇不在港
内避免被敌军核突袭一波打掉，那潜艇的战备值班平均时间要至少73天以上。平均50天
的战备值班只能保证一年有250天有一艘核潜艇不在港，另外还有115天左右有8艘核潜
艇全部在港（还有2艘左右潜艇在船厂维护），美军只要保证在... 阅读全帖

发帖数: 1

来自主题: USANews版 - 美国人口普查为什么要恢复国籍问题

美国2020年人口普查加入国籍问题是特朗普移民政策与执政理念的延续，同样是共和党
的政治手段的直接体现。美国自1790年开始，每10年进行一次人口普查，而每一次都询
问国籍问题。最后一次普查加入国籍问题还是在1950年，那次普查之后再也没有加入过。
加州总检察长就向美国商务部及人口普查局提出指控，要求联邦法院发布禁令，裁定这
一举措违反宪法。准确的人口普查至关重要。人口普查数字为加州社区未来数十年的发
展提供了关键数据。如果特朗普政府改变人口普查规则，加州将遭受惨重损失。加州预
计有1000万外国出生的居民。特朗普政府决定在人口普查中加入美国公民的问题，将使
非公民者躲避调查，从而淡化倾向于支持民主党的人群。
特朗普上任之初的口号就是雇美国人，买美国货，他认为长期以来宽泛的移民政策促使
了非法移民挤压国内就业岗位，而且工资需求不高，对于本土工人来说颇具竞争力。再
加之由移民带来的安全问题也是一直争议的焦点。而特朗普凭借民粹主义上台，其主要
支持者大多就是来自美国本土的蓝领，这使得其移民政策势必要更加严苛，以确保自身
演讲与政策的连贯性，所以他要在美墨边境修建隔离墙，结束抽签移民，并且改... 阅读全帖

B********i
发帖数: 371

来自主题: EB23版 - 贡献一个自己整理出来的07 年大潮后的perm 数据。

贡献一个自己整理出来的07 年大潮后的perm 数据。
---2007--- ---2008---- ---2009--- ---2010-----
---EB2---EB3-- --EB2----EB3-- --EB2---EB3--- ---EB2---EB3---
Jan. 6----14. 340----124. 181-----74 132-----47
Feb 11----10 263----127 166-----45 96-----36
Mar 26----11 232----115 141-----64 125-----33
Apr 56----37 229----119 139-----65 93-----24
May 101----67 275----162 108-----66 120-----34
J... 阅读全帖

d*****8
发帖数: 402

来自主题: EB23版 - 13FY实批数据

你说的没错，可是inventory也需要时间生成，现在才一月份就算出了inventory也很难
看出来到10月份这一整年会有多少inventory。但是我的推测是从vb的截止日期算的，
截止13年10月份批到的绿卡应该是往前数三四个月的时候提交的，往少了算也是july
vb-09年1月，而从niu 的140数据看 eb3c 09年2075个140case，（误差包括升级的，
family，cp）所以再怎么算误差14财年的quote也会被填满对吧。

★ 发自iPhone App: ChineseWeb 8.2.2

d*****8
发帖数: 402

来自主题: EB23版 - 13FY实批数据

p****c
发帖数: 8062

来自主题: Basketball版 - 今天这哨子也太黑了

呵呵原来数据有误差是时间久远，今儿个数据误差这么大是因为?

B********s
发帖数: 1617

来自主题: PhotoGear版 - 求问误差范围的公式

我有一列实验数据 Set A, 还有一列数据 Set B.
实验结果 C = A / B, 表达成 percentage +/- error range, 比如 90%+/- 3
可是这个误差范围怎么求的呢？
Standard Devation (set A) / Standard Devation (Set B) 好像不对吧？

b*****t
发帖数: 9671

来自主题: Automobile版 - NHTSA投诉数量按车型数据，供参考

列出了版里经常讨论的车型，可能有些遗漏
另这只是投诉数据，没找全销售数据，所以就不列了
不过dfbb平均一年30多万，fusion，malibu，focus，crv，escape这些平均只有一半，
其他应该平均10万上下
大致可以参考下
NHTSA这个板板给的数据是个200多m的txt文本文件压缩包，操作起来挺麻烦
害我倒腾了一晚上
里面数据从80年代前后到2010年的都有，数据上年份不是统计数据的年份，而是指车型
年份,数据截止到2010年3月2号
另，因为文本内关键词可能有差异，所以可能小部分数据会有误差
不过总体上应该是比较完整，全面的
有兴趣的可以自己去nhtsa下载数据研究
第一个图片过大，所以显示不完全，可以点到新窗口或者存下来看

m********5
发帖数: 17667

来自主题: Programming版 - 中国全面启动人类蛋白质组计划, 做大数据的可以去分钱

显然不是
这个计划说白了，就是让生物学家和医院积累大量原始数据
看普通人和病人蛋白表达上有哪些差异，哪些没有差异
但数据出来了是不会有任何结论的，数据量太大，误差也很多
得有人来组织数据，评估数据，挖掘数据，解释数据
说白了，千老就是造数据的，后面真的活儿还得码工和数学家干

e*******o
发帖数: 4654

来自主题: Biology版 - Re: 中国全面启动人类蛋白质组计划, 做大数据的可以去分钱 (转载)

【以下文字转载自 Programming 讨论区】
发信人: mitbbs2715 (好吃不懒做), 信区: Programming
标题: Re: 中国全面启动人类蛋白质组计划, 做大数据的可以去分钱
发信站: BBS 未名空间站 (Wed Jun 11 18:57:10 2014, 美东)
显然不是
这个计划说白了，就是让生物学家和医院积累大量原始数据
看普通人和病人蛋白表达上有哪些差异，哪些没有差异
但数据出来了是不会有任何结论的，数据量太大，误差也很多
得有人来组织数据，评估数据，挖掘数据，解释数据
说白了，千老就是造数据的，后面真的活儿还得码工和数学家干

c***s
发帖数: 70028

来自主题: Headline版 - 陕西矿工偷5000枚雷管私卖案 DNA对比结果出现罕见误差

5000余枚雷管被盗，省、市领导相继批示要求迅速破案，公安部督办，“证据之王”DNA比对成功，最终却发现嫌疑人根本不具备作案条件，六亿分之一的误差概率在此案中出现……
白水县近百名专案民警历时59个昼夜，分赴山西、四川、河北等6省23县市破获此案，犯罪嫌疑人贾某、廖某2人以涉嫌盗窃爆炸物被刑拘，唐某等8人以涉嫌买卖爆炸物被刑拘。
省市领导批示要求公安机关迅速破案
9月11日，白水县公安局接到县龙泉煤炭有限责任公司报案，称该矿井下库房5000余枚雷管被盗。案情重大，县公安局刑警大队民警立即赶往现场调查。办案民警李云平说，由于案件涉及爆炸物品数目较多，省、市领导都作了重要批示，要求公安机关迅速破案；公安部也将此案列为督办案件。9月12日上午，白水县公安局成立专案组，60余民警组成摸排组、视频排查组、重点人员线索核查组等4个小组，对案件展开调查。
“我们以龙泉煤矿人员为主，并对周围村庄的闲散人员以及历年打击过的涉爆人员为重点对象，排查了5000余人。”李云平表示，同时还在设立的关卡口对2万多车辆进行了拍照、调查。
DNA比对“冤枉”永寿一男子
9月20日，在距龙泉公司1公里处的白云路旁庄稼地... 阅读全帖

g*****y
发帖数: 7271

来自主题: Tennis版 - 录像测发球球速以及与雷达数据比较

FT，你理科男？反正我是工科的。
不用瞎凑数据去解释误差，误差来源太多，不是都需要解释的。
你得去看人本来公式推导怎么推导的，有什么简化，有什么假设，
才能去推导误差的来源，你这种搞法明显是理科男发文章心切，
凑数据呢。

K****D
发帖数: 30533

来自主题: Tennis版 - 录像测发球球速以及与雷达数据比较

偶工科阿。偶的意思就是如果偶发明一个仪器测速，发现误差5%，然后又发现
考虑弧线vs直线长度矫正可以消除这个误差，那偶就毫不犹豫地使用了。根本
不会去数学分析。数学在工科范畴绝大多数情况啥问题也解决不了（或者说
在合理budget之内）。一切都只需要试验然后凑经验公式。
你这个问题哪怕用什么复杂微分方程推导了，可能纠正效果还不如偶这个小学
数学级别的纠正法。
如果此后又发现了什么新的误差，那再发明另一种简单纠错法。

g*****y
发帖数: 7271

来自主题: Tennis版 - 录像测发球球速以及与雷达数据比较

就像asus最初估计并认为误差4.7%，我指出他是球到底线的距离估计不对，
对了的话误差在1%多一点。
你要用弧线来解释？准备搞个0%误差？我觉得你凑不了那么准。
而且凑太准了，别人倒会怀疑你的可信度了。就像asus的PS。哈哈

l********e
发帖数: 415

来自主题: Biology版 - QPCR数据计算

这是个好问题,很多人都不知道怎么算.
当然,我也不确定我的算法是不是对的.
参考这里的说明,
http://www.phy.ntnu.edu.tw/demolab/html.php?html=Notes/dataProc
因为Q-PCR的control组和experiment组, 结果的测量方法一样, 所以误差是相关的.
我的算法之一就是两者标准差直接相加.
或者,计算結果的百分误差的平方(等于个別参数的百分误差的平方和),跟第一种算法比
较,取较大的那一个.
插句题外话, 其实统计最重要的还是confidence, 你blind试验能感觉出两组不一样,那
就是不一样.具体怎么算, 都是浮云.

s********n
发帖数: 5

来自主题: Mathematics版 - 请教一个非线性数据拟合的问题

我有一组m*n维输入矩阵X和对应的m*1维观测向量Y (由于仪器和人的因素，Y肯定存在
误差)
P和Q是待拟合的系数，P(1)=1,下面为了书写方便，保留P(1)的写法
目标函数y(i)=(x(i,1)*P(1)+x(i,2)*P(2)+...+x(i,n)*P(n))/(x(i,1)*Q(1)+x(i,2)*Q
(2)+...+x(i,n)*Q(n))
我尝试用matlab的nlinfit做拟合，但是这个函数把所有的Y都回归到Y的均值附近，
即原始的y是一个0到0.5的分布，但是拟合出来的fitted value集中在0.25附近
我也尝试过把目标函数变成线性的拟合,即把y和分母相乘然后变成一个关于P和Q的线性
拟合，效果也不好，
可能是因为Y本身的观测误差，当Y与X相乘以后，该误差会影响一半的线性变量。
请问有没有更好的方法解决这种拟合的问题。谢谢

b*****e
发帖数: 2511

来自主题: Statistics版 - 发包子求问 Lorentz distribution 拟合的误差

对一组数据进行了Lorentz fitting, 拟合的误差应该怎么算的？ Lorentz
distribution里的Gamma应该只是和这个distribution有关和拟合误差没有任何关系吧
？

p*****c
发帖数: 20445

来自主题: Military版 - 2010年第六次全国人口普查主要数据公报[1]（第1号）

2010年第六次全国人口普查主要数据公报[1]（第1号）
中华人民共和国国家统计局
2011年4月28日
根据《全国人口普查条例》和《国务院关于开展第六次全国人口普查的通知》，我
国以2010年11月1日零时为标准时点进行了第六次全国人口普查[2]。在国务院和地方各
级人民政府的统一领导下，在全体普查对象的支持配合下，通过广大普查工作人员的艰
苦努力，目前已圆满完成人口普查任务。现将快速汇总的主要数据公布如下：
一、总人口
全国总人口为1370536875人。其中：
普查登记的大陆31个省、自治区、直辖市和现役军人的人口[3]共1339724852人。
香港特别行政区人口[4]为7097600人。
澳门特别行政区人口[5]为552300人。
台湾地区人口[6]为23162123人。
二、人口增长
大陆31个省、自治区、直辖市和现役军人的人口，同第五次全国人口普查2000年11
月1日零时的1265825048人相比，十年共增加73899804人，增长5.84%，年平均增长率为
0.57%。
三、家庭户人口
大陆31个省、自治区、直辖市共有家庭户[7]401517330户，家庭户... 阅读全帖

b*******t
发帖数: 4756

来自主题: Military版 - 亚马逊平台的数据显示

转贴：
摘要：亚马逊平台的数据显示，中国卖家已经占据其四分之一的市场份额，在可预见的
未来，这个比例还会增长。一场轰轰烈烈的中国卖家下西洋运动开始了。
亚马逊这个电商帝国里的中国卖家可能远超我们的想象。据中国电子商务研究中心的数
据，2017上半年，跨境电商交易3.6万亿元，其中，出口跨境电商交易2.75万亿元。亚
马逊平台的数据显示，中国卖家已经占据其四分之一的市场份额，在可预见的未来，这
个比例还会增长。
亚马逊自2012年开始招募中国卖家入驻，此后中国卖家开始不断扩张势力。仅2015年一
年，亚马逊中国卖家的总销售额比上一年增长了两倍，仅美国站，中国卖家的销售额就
增长了10倍。据外媒报道（http://m.cifnews.com/article/30938 ），截止2017年11月30日，今年有1001210名新卖家，入驻亚马逊全球12个站点，近三分之一是来自中国。根据亚马逊欧洲平台所提供的数据显示，中国卖家在亚马逊平台上的份额约为25%。
跨境电商在很大程度上是传统外贸转型的结果。譬如今年8月，出口跨境电商公司有棵
树被天泽信息以34亿元收购，其早期业务就是传统的外贸生意（航... 阅读全帖

x*****c
发帖数: 1005

来自主题: Chemistry版 - 苏黎世联邦理工学院(ETH)发现伪造数据,副校长陈彼德(Peter C

瑞士苏黎世联邦理工学院(ETH，简称：苏高工)发现伪造数据，该校研究和经济关系部
副主席、10年前该项目的负责人
陈彼德(Peter Chen)辞职，但他将继续从事化学方面的研究工作。
9月21日周一，苏高工公布消息在3份研究报告中发现有数据伪造现象，因这有损学院名
誉，所以陈彼德的领导工作将只
进行到本月底。但谁是伪造数据的直接责任人，目前还不清楚。
被发现有伪造数据现象的文件是化学系的1篇博士论文和2篇于2000年发表的研究论文。
陈所领导的研究小组撰写了这
些论文。论文内容与用特殊科技方法分析碳氢化合物基的结构有关。
发现错误
10年前相关论文发表后，一些其他研究者发现，依照此程序试验得出的数据与论文中所
提供的相差甚远。陈及其合作者
不能对此误差做出解释，他们也不能再次制造出原试验的实测数值。因此陈于2009年1
月向苏高工提出申请，要求成立
科学委员会对此进行调查。
苏高工校长Ralph Eichler先生在媒体电话会议上表示，2009年初成立了专门调查此事
的科学调查委员会，该委员会证
实，以上研究的数据确实是伪造的。例如试验中相同的噪声图竟然连续出现2次，这事
实上是不可

g*****g
发帖数: 6798

来自主题: History版 - 1931─1934年死亡率

我就是疑惑这个问题,
所以才算的,
考察平均值
富人的数据完全准确是数学平均值,
中人的数据误差没问题也可以0.06%,
这两个数据可以说明这两类人的比重并物明显变化.
然后穷人的数据变化和数学平均值偏差交大.0.33%
再回头把三项中的数据算一下权重,
穷人比重至少不低于中人比重
也就是说,0.06和0.33两个数据矛盾

m***a
发帖数: 13878

来自主题: Military版 - 中国高龄农民工或已超4000万官方暂停公布数据

2015-03-20 13:09:00 来源: 澎湃新闻网(上海)

2015年2月27日（正月初九）重庆开县团凤村，66岁的李家护准备回家。今年66岁
的李家护早在7年前就结束了外地打工之旅，曾经去过绵阳、广东东莞等地方。7年前，
老伴身体不好，走不得路，自己也59岁了，考虑到自己年岁也高，回家照顾老伴。澎湃
新闻记者程艺辉图
在连续4年公布我国50岁以上农民工的统计数据后，国家统计局突然暂停公开这一
数据。
2013年2月，澎湃新闻（东方早报）率先将目光聚焦50岁以上的农民工（见《东方
早报》2013年2月26日刊登《第一代农民工面临高龄困境：养老问题将在5年内集中爆
发》一文），关注这一3000余万人群的打工生活、背后的辛酸以及即将到来的养老困局。
上述独家报道引发了舆论关注，央视、新华社、人民网等媒体此后对我国高龄农民
工的现象和问题进行了集中报道。
为全面、及时、准确地反映农民工数量、流向、结构、就业、收支、居住、社会保
障等情况，国家统计局于2008年底建立了农民工统计监测调查制度（此前，有些省、市
自行统计发布），至今... 阅读全帖

j**********n
发帖数: 7

来自主题: ChinaNews版 - [转]36 页详文分析谭久彬-哈工大国家发明技术一等奖得主数据造假

耳闻的谭久彬教授博士论文数据造假一直因为未能看到第一首资料而未能详查。最近同
事间接到一份<<哈工史上唯一发明一等奖数据造假>>的邮件，随附36页详细分析。谭久
彬教授给人的印象是谦和有礼之人，没想到敢如此明目张胆伪造数据。
名不见经传的圆度/圆柱度（谭久彬教授伪造数据的国家发明一等奖项目所属领域）用
在导弹制导上。仅有数枚的中国最强洲际导弹-东风5导弹仍沿用传统惯性制导系统。
采用“惯性三轴静压气浮陀螺及空间计算机”。精度(CEP)：500-2000米
其中惯性陀螺的主轴精度直接影响导弹制导精度。也就是谭久彬教授获国家发明一等奖
的超精密测量仪器的最终精度直接影响我国最强洲际导弹得命中精度。
即是说，谭久彬教授号称4纳米的高精尖仪器实际比对精度只有14纳米（详细分析见上
述36页详文分析），而国际上用来比对的同类精度指标都在5纳米。
14纳米和4纳米的差别直接影响着导弹命中误差扩大三倍。而中远程导弹如果不能精确
打击易被拦截（如朝鲜金三胖的导弹），更何况洲际导弹。

o***s
发帖数: 42149

来自主题: Headline版 - 红会回应明星捐款质疑：海量捐赠数据难免出错(图)

李连杰捐款情况查询
中国红十字会总会捐赠信息发布平台7月31日上线试运行引起社会广泛关注，截至昨晚21时，中国红十字会总会捐赠信息发布平台上线30个小时，该信息发布平台的点击量已达到2600余万。在肯定红十字会总会向公开透明迈出重要一步的同时，不少网友也对平台发布的数据等提出质疑。对此，中国红十字会总会有关负责人作出回应。
中国红十字会秘书长王汝鹏说，平台本来计划下半年上线，大家看到的是加班加点提前上线的平台。信息发布平台中海量的捐赠数据需重新整理、录入、核对，难免出现疏漏，而且发布平台还不完善。信息平台上公布了咨询电话，接受意见和建议。中国红十字会经过郭美美事件引发的巨大信任危机，王汝鹏说，下一步除完善信息平台以外，还要改进机制，拟建社会监督委员会和项目监督委员会。
捐善款是否定向应亮明
即捐赠人捐了多少钱，什么时候捐的，是否为定向捐款，捐给了什么项目等，这些信息都应在平台上很明确。宋宗合认为，对于公众来说，目前捐的这一环节还不是最吸引注意力的。针对有和没有捐赠意向的善款，要进行区分，明确流程。
转善款增值与否要公示
即一笔钱捐到慈善组织，它要走的一个流程。在这个流程中，善款中会... 阅读全帖

l*******n
发帖数: 8388

来自主题: EB23版 - 从timeline数据估算3C下几个月进度+FY14 3C使用名额

昨天一时心血来潮，去看timeline，download 下来后随便sort了一下。看了数据，有
了一些初步是想法，供广大网友讨论。粗略想法，请数据控和大牛们指正，请网友们随
便comment。我会再根据大家意见修改。
------------
最后结论：如果以2.5K 的quota来计算， 3C跃进会到 12年7月，左右3个月，即（12.
4， 12.10）
如果以3K 的quota来计算， 3C跃进会到 12年10月，左右3个月，即（12.7， 13.1）
请君自选
------------
NOTE：这里只分析了primary applicant的分布。counting dependent最多只是稍微改
变一下每年的数据。因为timeline上面只有700个entry，而我是根据PD 的
distribution来估计每年有多少绿了，多少pending。assume每年的人添加dependent
的比例是一样的，counting dependent对分析的影响不大。因为作为降级总量的5K，
还是不变的。
只有总量5K改变的情况下，排期才会有较大的改变。
具体分析如下：
t... 阅读全帖

l*******n
发帖数: 8388

来自主题: EB23版 - 从timeline数据估算3C下几个月进度+FY14 3C使用名额

i*S
发帖数: 175

来自主题: Biology版 - 请教：两组数据平均值相减，标准偏差怎么算

我现在有两组数据A和B，需要两组数据的平均值相减得到我要的最终数据。
如果A和B本身的标准偏差都不一样，我该怎么算相减后的标准偏差和标准误差呢？
每组中每个数据都是独立的。一个是treat组，一个是control组。
谢谢!

L********l
发帖数: 575

来自主题: _pennystock版 - 关注下周非农数据 (转载)

【以下文字转载自 Stockcafeteria 俱乐部】
发信人: wikki (2010), 信区: Stockcafeteria
标题: 关注下周非农数据
发信站: BBS 未名空间站 (Sun Mar 28 10:34:50 2010, 美东)
统计了2008年1月份开始的非农数据，发现每次的预测值和实际值最大误差200K(2008.
12)，下周的预测值目前是190K，非常有可能3月份的数据要变负为正，这对股市应该是
个不小的刺激吧，数据如下，中间有两个月没有统计完全(2009年8月和9月)：
actual forecast previous
mar 190K -36K
feb -36K -68K -26K (R-)
jan -20K 15K -150K (R-)
2010
dec -85K 0K -11K
nov -11K -125K -111K (R+)
oct -190K -175K -219K (R+)
sep -139K
aug -216K -230K... 阅读全帖

o***s
发帖数: 42149

来自主题: Headline版 - 媒体疑香山红叶没官方数据红回应称黄叶也算变红(图)

27日香山红叶变色率达到72%，但仍难有“漫山红遍”的感觉摄影/本报记者贾婷
“26日，香山红叶变色率已达到60%，进入最佳观赏期”的消息吸引了来自全国各地的游客前来香山赏红。上周末，香山公园接待约20万游客，创下了本届红叶节开幕以来双休日接待游客量的新高。但许多蜂拥而至的游客抱怨并没有感觉到“漫山遍野”的红叶，这个“红叶变色率”的预报到底是怎么预报出来的？北京青年报记者进行了探访——
游客质疑：最佳观赏期为何难见红叶
“到香山光看人了，没看到红叶。”日前，有游客反映在香山红叶的“最佳观赏期”里没看到园方所说的变色率达到60%的红叶，只看到拥挤的人群。昨天，北京青年报记者实地调查后发现，香山公园入口处的平地部分确实少见红叶，但南部红叶区树叶变红率基本符合官方发布水平。对此，香山公园管理处相关负责人表示，由于许多外地游客时间有限，无法登高赏红，才造成“香山无红叶”的误解，如果游客按照景区提示的赏红路线登高赏红的话，是可以观赏层林尽染的红叶美景的。
日前，“香山红叶变色率已达到60%，进入最佳观赏期”的消息吸引了来自全国各地的众多游客前来香山赏红。上周末，香山公园接待近20万游客，创下... 阅读全帖

i*****u
发帖数: 26

来自主题: Military版 - 东亚的田园洞人是雅利安人的祖先

正规发表的文章只是增加可信度吧，并不说明一定是对的，错误的文章也是不计其数，
尤其是作者有作假的目的时。当然你说得对，对于皇家Y-DNA，最直接的方法是挖皇陵
墓地，其它测后代的方法由于冒充/入赘/收养，甚至隔壁老王等等影响很大。大数据
的方法如果设计合理、数据量足够大，对这些影响的处理还是比较有效的，起码比怀有
特殊目的的正规文章更可信，当然最后还是需要古DNA确认。
国内搞DNA的那班人水平确实不怎么高，而且可信度成疑。比如良渚，有人说“复旦最
早的良渚早期测试根本是造假的，当时全世界都没那个技术，根据当时复旦提供有限的
数据误差在一半以上，大部分都是O3，江浙现有的O1是近一千年来由几个少数下游支系
爆发出的庞大人口，复杂性极低，没有早期根系，可以肯定与良渚或吴越均没有继承性
”。复旦对爱新觉罗的研究很奇怪，本来离的很近很容易研究，非要舍易求难，结果还
很难令人信服。对曹魏的研究有随意选取和操纵数据的嫌疑，可信度也很低。

w***i
发帖数: 357

来自主题: _Stockcafeteria版 - 关注下周非农数据

统计了2008年1月份开始的非农数据，发现每次的预测值和实际值最大误差200K(2008.
12)，下周的预测值目前是190K，非常有可能3月份的数据要变负为正，这对股市应该是
个不小的刺激吧，数据如下，中间有两个月没有统计完全(2009年8月和9月)：
actual forecast previous
mar 190K -36K
feb -36K -68K -26K (R-)
jan -20K 15K -150K (R-)
2010
dec -85K 0K -11K
nov -11K -125K -111K (R+)
oct -190K -175K -219K (R+)
sep -139K
aug -216K -230K
jul -247K -328K -443K (R+)
jun -467K -365K -322K (R+)
may -539K -600K -699K (R-)
apr -663K -660K -651K
mar -651K -

y**c
发帖数: 6307

来自主题: History版 - 三千万是建立在泥沙上的结论

若有？到底有没有？为什么不说10%？干脆说这个数据误差太大，那误差究竟是多少？
反驳建立在假设上，那更他妈的是泥沙，还好意思说别人证据脆弱。
"而且资料遗失、不完整、漏报逃报、人口流动、机构精简、行政区划更改……任何一种
情况都会削弱统计数字的真实性。而以中国的人口基数，若有平均1%的基层户口机构停
止运转，1%的人口因逃荒而离乡，1%的人口的生死漏报谎报了，都会出现5、6百万人的
数字变化。"

xt
发帖数: 17532

来自主题: Military版 - 看看这些所谓文明人是怎样在气候数据上造假的

1) 那1000个就能代表99%?那些人怎么来的？所有科学家投票选的？
2) wiki在自然科学领域还是挺有用，在关于AGW这种跟人有关的问题上，
恐怕就不那么可靠了吧？要我我都不好意思腆着脸提wiki;
3)全球变暖(GW)和人类导致全球变暖(AGW)不是一回事，全球最变暖完全可能，
但是不是人类导致的，不好说。
4) 人类排放量只占总排放量0.28，我首先想到的是，这里面有多大误差？
先讨论一下剩下那99.72%会不会有这么大的波动?首先我想到的是，你这99.72%
测量绝对误差可能都不只0.28%，有没有可能人类活动产生的温室气体
会被自然的波动淹没？历史上大气中二氧化碳含量也不是一直不变。

D******n
发帖数: 2965

来自主题: Military版 - 战争中的伤亡统计谁说了算？误差多少？尤其是亡的

人为虚报比技术统计误差更可怕。这就是为什么要拿几方数据反复比较：国军宣称的伤
亡，日军公布的杀伤，再比较太平洋作战中，日军公布的杀伤和美军公布的伤亡，反复
比较才能明白这些数字。
真要统计精准，有那么难吗？现在连挖个骷髅出来都能知道是唐朝还是汉朝的。

V****n
发帖数: 651

来自主题: Military版 - 进北清的难度比进harvard,yale,princeton的大１０倍以上：数据

就算单纯比被录取的可能性高低，你这种算法也太简单了。
这种比较之所以没什么人吃饱了撑去搞，就是因为计算太难，就算估算误差也太大。
不算北京户口，高考扩招以前北清一年在每个省录取大概20人吧，而全国高考考生一直
在50万左右（扩招后到800万）。但是50万里面，真正第一志愿填北清的有多少人？没
有人知道吧。当然我可以估算，全国最好的学生基本上还是集中在那一两百个省重点中
学里，一个学校300人，第一志愿敢填北清的可能不超过5人，5乘以200吧，也就1000人
。就算算上哪些瞎填一气的，非省重点的，等等，我估计不会超过5000人。所以，要算
录取率，也应该是录取的600人除以5000，也就是刚过10%。我承认这个百分比误差很大
，也许100%以上（所以我不会去搞这种什么比较,尤其是学校水平差别那么大的情况下
）。接下来，北清的不同专业招生分数差别大了去了。比如北大物理在我以前的省份只
录取1-2人，所以710总分要620左右，而北清普通专业570到580就可以进了，把这些混
合起来平均本身就不是合理的计算。为什么不合理？因为HYP根本无所谓什么不同专业
不同录取分一说，任何人进去都可以上所... 阅读全帖

r*****3
发帖数: 6442

来自主题: Military版 - 最权威的各省市智商数据

没意义，8000万的省，取1000人，误差会大得惊人。
他们自己也说了，误差正负16左右，你116可能就是100，而100的其实可能是116.

d*****8
发帖数: 402

来自主题: EB23版 - 13FY实批数据

哈哈你还是来和我讨论讨论我的分析吧。我其实很偏向ｅｂ２了。　１３年６月　ｅｂ
３ｃ　ｖｂ是０８年１月。　１３年７月ｖｂ是０９年１月。　我在１２楼和２楼里的
分析都是算所有０９年以前的ｃａｓｅ都绿了的　：）
大家都知道这是不可能的因为仅０８年一年就有２０３６　ｅｂ３ｃ　１４０　ｃａｓ
ｅ。（误差ｆａｍｉｌｙ，　ｃｐ，　升级）
ａｎｙｗａｙ即使这么算ｅｂ３ｃ都有充足的１４０数目。这个数目的误差其实很小很
有参考价值，不比什么ｅｗ大厨阿之类的说等了好几年最后放弃不知道到底多少人之类
的。
ｂｔｗ，你不要拿“保证不保证”什么的说事好不，我又不是奥本。。。这样只能显示
你没啥水平嘛。　如果你觉得我的分析有误，就像老Ｈ，　ｆｕｗｕ啥的指正出来我很
愿意修改我的预测。毕竟如果你能算出来ｅｂ３ｃ数目不够我还是会很开心啊，总比被
降级的大水冲退回去好。
ps.明年再说就是事后诸葛亮拉，要先在说的对让人信服才是大牛。。我在努力向牛人
靠拢～～

d*****8
发帖数: 402

来自主题: EB23版 - 13FY实批数据

s******y
发帖数: 1117

来自主题: EB23版 - 用PERM数据估算排期靠谱吗？

看了近几年的PERM数量：（因为看版上报绿的都是12财年的了，所以2012以前的就不看
了）
2012: 3879
2013: 2504
2014: 5107
2015: 7217
本人PD是14年4月（9.25事件受害人……），假设上述所有人批绿卡的日期按照PD顺序
均匀分布，而且PD也是均匀分布整个财年，再假设从2016年1月1号开始批2012年的那些
人，那我算了一下还要等20个月才能拿卡。
这个计算有很多误差：
（1）PERM里有withdraw的，而且也不一定所有这些PERM最后都排EB2EB3，所以上述数
据是over-estimate
（2）我算的每年EB2C+EB3C 5300人，假设每年这5300个名额都能用满。可能用不满，
那样这个算法就under-estimate
（3）批绿卡的时间均匀分布。这个我实在不知道该怎么做model，所以就用了最简单的
linear interpolation.
问题就是我也不知道这些误差里面哪些大哪些小，哪些能dominate最后结果。总之如果
真的两年之内拿卡的话感觉还可以。不知道如果算得过于乐观了的话乐观了多少……

p**p
发帖数: 10318

来自主题: Soccer版 - 午休时又测试了一次带球跑，数据如下

【项目】直线带球跑
【备注】既不是运球，也不是纯粹的带球跑，因为考虑到精度和对球的可控性，计入了
触球次数，应该说是，考虑触球次数的带球跑。
【参数】草地，长度60米，人工测量，误差正负2米以内。所用时间，两次均为10秒，
触球一次为13次，一次为14次。
【体会1】基本上能让球控制在不出脚2米以外，有个别的可能2米多，但绝大部分都在2
米内，因为是感觉可能有误差。总体感觉对球还能有控制，定义的控制，即，过程中，
感觉（不一定能实现）可以完成变向等简单的技术动作。但没有加花儿，比如一脚外脚
背触，一脚脚内侧触等技术没有加入，也没有强调节奏感（这个节奏感，先提一下，以
后专门写，我的一大心得，与众wsn分享）
【体会2】总体对自己还是比较满意，因为这是在我先跑步，体力有所消耗的情况下完
成的！天有点热，第一次打算跑这么远，还是有些惴惴，对自己说，要坚持，慢跑速度
，一定要实现既定目标，不管花多长时间，底线就是不能停！！经过10个往返。很兴奋
的给老婆打电话，I made it!!! 10年来，第一次连续跑了1.6 mile。老婆鼓励，说贵
在坚持。我颇有马拉多纳在女儿毕业时的激动（这个桥... 阅读全帖

g*****y
发帖数: 7271

来自主题: Tennis版 - 录像测发球球速以及与雷达数据比较

主要误差来源其实就是算平均速度误差的来源，也就是说，时间和距离
1. 时间：高帧数的，帧数间隔稳定的最好
2. 距离：离发球线越近的发球，越准确，最好是正砸在发球线上的。
另外，topspin会让这个公式估计出来的速度偏小。
再另外，外角发球估计出来的也可能偏小。
反正我还是不很相信手机，稍好一点的傻瓜机能录像的，都应该还好。

x****i
发帖数: 50

来自主题: Biology版 - 写了一个较通俗的RT-PCR数据计算的简介

纯理论上讲，ct不能取算术平均值是对的，因为ct其实是指数。
但在所有的计算中，我们都去算术平均值，绝大多数人（甚至权威杂志）没有异议呢？
这是因为在大量sample的重复试验中，ct值是接近正态分布的。注意，这里说的是ct值
，而不是你真正的sample在每个管子里的loading量。这个ct是我们从机器直接读出来
的，它的正态分布特性是有机器的系统误差所决定的。一般来说，ct值的已经包含了而
且大于你每个管子loading量的误差，它的正态分布特性是ct值取平均值的理论依据。
欢迎讨论。

x****i
发帖数: 50

来自主题: Biology版 - 写了一个较通俗的RT-PCR数据计算的简介

g*****x
发帖数: 3283

来自主题: Biology版 - mass spec 的误差

1. 首先你得明白MS测序的原理。33kd这个数字不是MS测出来的，是根据tandem ms的结
果从数据库里match出来的。
2. 所以你的问题在于蛋白的identification，不在MS的误差。
3. 你蛋白纯度怎么样？tandem ms方法没办法保证100%的coverage，如果你的target蛋
白只占10%以下，很难保证一定能做出来。

mass
marker

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天