l****e 发帖数: 609 | 1 首先呢,骂人不会让人觉得你有理,反而会显得你理亏。
我还真不懂stratified sampling,请你别卖嘴皮子。我觉得方舟子说得很在理,请你
试着给大家说说为什么polling公司是结果是错的。
总统辩论谁赢了?
·方舟子·
今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政
党的总统候选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎
所有美国媒体请的裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选
人川普。但是辩论的胜负判断本来就是很主观的,即使媒体一致认为希拉里获胜
也不会让川粉(川普的狂热支持者)接受,因为他们本来就认为美国主流媒体基
本上都是自由派,都是支持希拉里的。举行辩论的主要目的是要影响选民,那么,
我们可以给胜负定一个客观标准,那就是认为哪一方获胜的选民人数比较多,这
一方就获胜了。第一场辩论刚刚结束,CNN就立即报道了他们通过一家民意调查
机构ORC对521名选民做民意调查的结果,62%认为希拉里赢,27%认为川普赢,据
此可以说... 阅读全帖 |
|
m****r 发帖数: 237 | 2 给你普及一下常识。做poll,首先要保证调查取样的样本是representative的,也就是
说你取样要符合选民的分布。如果你的取样里面有over-represent,那么你得到的结果
就会不准确。最极端的例子就是,你抽样1000个人,1000个都是民主党,那么得到的结
果肯定没办法正确,即使你在民主党里面随机取样了。所以你在做poll的时候需要严格
设计你的取样标准,最大化的达到represent真实的情况。方舟子那傻逼说了那么多,
根本不知道CNN这些媒体抽样是咋进行的。如果他可以给出CNN抽样的500多人都是哪个
党派的,男女比例,house income,employment status,甚至race,并且证明这些都
是符合真实美国人口比例情况的,才能说这样的sample有意义。不然你有over-
represent的sample,是得不到正确结果的。而且最近几次MSM的poll都是民主党比例很
高,female比例很高,很难代表真正的选民比例。所以根本没办法得到正确的
inference。并不是说trump是领先的,只能说这些poll在目前的情况下无法得出
Hillary... 阅读全帖 |
|
l****e 发帖数: 609 | 3 谢谢您的知识。受教了。我是外行,但如果群体不符合选民的分布,可以用上权重。
方舟子说
“所以,要对全美国做民意调查,随机抽查300人也是可以的,川普、川粉的
嘲笑只不过暴露了他们对统计学的无知。不过,抽查300人的误差有些大,全国
性民意调查的误差一般控制在3%左右,因此需要的样本大小通常是1000人左右。
CNN/ORC调查了521人,误差是4.5%,误差稍大,但是因为调查的结果比率悬殊
(62%:27%),这个误差并不会改变希拉里大胜的结论。CNN/ORC调查采用的是简
单随机抽样的方式,这样抽得的随机样本不一定能很好地符合人群分布特征,例
如其中认同民主党的人数偏高。所以有时候为了获得能代表人群分布的样本,会
采取分层抽样的方式,先根据人群特征设定各个群体的比例,然后再在各个群体
随机抽样。”
CNN用的是"random-digit dialling,",见下面的英文
http://edition.cnn.com/ALLPOLITICS/1996/polls/FAQ/polling.FAQ.shtml#howinterview
方舟子还说
“因为是抽样调查,即使精心地设计,也不能... 阅读全帖 |
|
d*********o 发帖数: 6388 | 4 http://money.163.com/13/0326/07/8QSK2OUV00253B0H.html#p=7265KM7
市场随机抽样8份牛肉制品,5份竟无牛肉成分
经销商:牛肉制假是业内公开秘密,记者历时两周“追肉”
戳穿牛皮,假牛肉现形
近段时间,牛肉成为全世界的焦点。欧洲爆出“马肉丑闻”,假牛肉卖到16个国家,
“挂牛头卖马肉”一时让欧洲人心有余悸。
那么,我们身边的市场里,那些牛肉熟食、羊肉切片可靠吗?事实是令人触目惊心的。
年前,辽宁捣毁了一个假羊肉加工厂,不法分子把廉价鸭肉冒充羊肉销售。
杭州市场上卖的廉价牛肉制品质量不容乐观,本报“民生实验室”取了8件样本,送权
威机构实验室检测,有5份没有检测出牛肉成分,且全部含猪肉。编辑部戏称,《西游
记》里“牛魔王”说不定也是“二师兄”假冒的。
3月10日,本报记者从杭州的农贸市场、晚间大排档、路边烧烤店、卤味店等随机抽取
了8份牛肉制品,委托浙江省检验检疫科学技术研究院动物检验检疫实验室进行权威的
DNA测试。
“以为牛肉最多也就是注水,没想到竟然吃到假牛肉。”消费者李女士也向本报反映,
她吃到的“牛肉”味道、嚼劲和自己以前... 阅读全帖 |
|
g********2 发帖数: 6571 | 5 左弊的水平真不是盖的!
前几天护士(THR)已经出来献过丑,被人批驳过了,昨天又有一个不怕丑的左弊
likeke跳出来,继续献丑。
可见左弊心目中的民调,就是抓起电话,一通乱拨,拨到男的是男的,拨到女的是女的
,拨到民主党,那就是民主党,拨到共和党,那就是共和党。
这就不仅仅是没有丁点民调知识了,根本就是没有common sense,没有脑子!
如果民调就是这么乱拨一通,怎么保证抽样涵盖性别,年龄,收入,党派,等等等等?
按左弊的理论,最好是抓只老母鸡来,按照鸡爪子刨的方向决定给谁打电话。
那个才叫做:随鸡抽样!
-------------------------
发信人: likeke (知音难觅,知己难寻), 信区: USANews
标 题: Re: 电话poll的另一大不靠谱
发信站: BBS 未名空间站 (Sun Oct 16 16:44:59 2016, 美东)
当然还是承认这个poll 的,因为每个poll 都有误差和置信度。
你做一个抛硬币的实验,不会每次都是5正5反。
polling公司随机抽查人群打电话,说不定某一次共和党选民居多也可能。做专业调查
的公司,自有它的... 阅读全帖 |
|
l***o 发帖数: 5337 | 6 需要抽样估计一个系统的precision和recall。第一感很简单,但仔细想来有很多麻烦
。现在population中有很多class, 每个class中有若干element,每个class的大小差很
多,很大部分是singleton(只有一个element)。问题:
1.应该把class还是element当作抽样unit呢?
2.把样本交给人手工分析时,分析的scope是什么?比如说,只问某个cluster在样本中
是否有recall的问题,还是到population里去找?
谢谢指教! |
|
n******g 发帖数: 17225 | 7
是,不是完全随机抽样的,是个潜在的问题。
我是在回应那个单纯询问为什么1%就能知道结果:1%只要有代表性也足够了。 |
|
g********2 发帖数: 6571 | 8 likeke的ID是“知音难觅,知己难寻”,可见她还没注意到THR就是她的知音。
两个人的民调手段是一样的,都是随鸡抽样。 |
|
g********2 发帖数: 6571 | 9 这个随鸡抽样的likeke又上来卖傻了,自己连stratified sampling都没听说过,还敢
说川粉都是non-college graduates。
中国大陆来美国念书的,大多数人都修过一两门统计课。
这个likeke确定读过大学? |
|
g********2 发帖数: 6571 | 10 你连stratified sampling都不懂,你觉得方舟子有道理有什么用?
你根本就不具备辩论的基础,也看不懂人家的反驳,谁陪你玩?
先下去学点抽样的基本知识再来发言吧,别总是丢人现眼。 |
|
l****e 发帖数: 609 | 11 自己读读英文吧,Simple random sampling也是一种Probability Sampling Methods,
我不是搞这行的,没有发言权,但我相信方舟子比你和这里绝大多数川粉强,人家说得
有理有据。
说了这么久,我怎么听不出你的高明之处,你能否把一个复杂的问题简单化了讲?你既
然单挑我,说随机抽查不科学,你总得说出过原由吧。
现在这个回帖,你不再是在说随机抽查的不科学性,而是在说CNN的抽样的电话号码不
是随机的,是在质疑CNN的credibility吗?
Probability Sampling Methods:
1.Simple random sampling
2.Stratified sampling
3.Cluster sampling
4.Multistage sampling
5.Systematic random sampling
另外www.aapor.org有关于Random-Digit Dialing (RDD)的介绍
http://www.aapor.org/Education-Resources/Election-Polling-Resourc... 阅读全帖 |
|
m****r 发帖数: 237 | 12 就说几句关于这个CNN的poll。根据gallup的party affiliation in likely voter,27
%是republican,40%是independent,32%是demoncrats。这个是2016年9月的数据。根
据这个数据,一个sample size是500的随机poll可以sample到>=41% demoncrats的概率
是9.5E-6。你还相信这个是随机的poll吗?如果你做statistical testing,p value是
8.01E-6。这个都是stats 101的课程。你可以自己去看看。again,这个数据并不能说
明CNN poll肯定有问题,但是很大概率这个抽样未必反应了真实情况。仅供参考。 |
|
m****r 发帖数: 237 | 13 换句话说,抽样十万次可以大概抽出一个这样的样本来。你可以继续相信CNN的样本是
随机的:)
27 |
|
g****e 发帖数: 56 | 14 2012年EB2开闸,最后一批EB2C的号差不多在LIN1290440000左右,所以从这个号开始往前
扫。
扫号范围:LIN1290340000-LIN1290440000
抽样办法:每100个号取1个扫
总共扫了1000个号
实际扫到没批的I-485:38个
1)推测范围段里没批的I-485:38*100=3800个
已知:
2)此范围只包含EB23I和EB2C
3)EB23I和EB2C的比例大概是13:1
由1),2)和3)可推测NSC未批的EB2C大概是3800/14=271个
欢迎大家踊跃讨论! |
|
s****5 发帖数: 279 | 15 感觉抽样和计算没有问题,总归有个估计数了。还要谢谢你的辛勤劳动! |
|
c****s 发帖数: 5892 | 16 据加通社消息,加拿大食品检验局1名的退休食品检查员指出,相比美国的肉食检查,加拿大的检查制度太松,美国在其边境检查几乎所有的进口肉类,但加拿大仅对进口产品的十分之一左右进行抽样检查,这为生物恐怖袭击(Bioterrorism)造成了条件,也给国民的食品安全带来威胁,尤其全球很多国家爆发过诸如禽流感、疯牛症等动物疾病,而本国也有李斯特菌爆发蔓延,因此堵塞进口肉类方面的漏洞已经刻不容缓。
加拿大入境肉检问题多
该检查员还表示,他在食品检验局工作35年,因此对上述问题特别担忧,尤其是不良商人如果将不安全的肉类运进加拿大,既有可能包括走私冒牌产品,也可能成为生物恐怖行动的理想方式。此外,即使十分之一被检查的产品,由于加拿大国内的进口商和食品加工商有可能选择不太负责的检查员,甚至贿赂某些检查员,就会使问题更难以防范,加上有的检查员刚刚从事此项工作,发现问题的专业经验不足,也会出现食品安全问题。 |
|
C*****y 发帖数: 1132 | 17 抽样楼层 支持选择 48楼2、3单元硕博 47楼1单元硕士 46楼1单
元硕士 36楼本科女生 39楼博士 41/42/43楼本科男生 总计 占回收
单项% 占回收累计% 占发放累计%
AAA+支持度 署名 12 15 21 23 13 92 176 19.1% 19.1% 11.6%
未署名 3 1 3 1 1 2 11 1.2% 20.3% 12.4%
AAA支持度 署名 20 17 20 30 20 74 181 19.6% 39.9% 24.3%
未 4 1 5 1 7 5 23 2.5% 42.4% 25.8%
AA+支持度 署名 11 5 8 17 10 38 89 9.7% 52.1% 31.7%
未 0 0 0 1 2 4 7 0.8% 52.9% 32.2%
AA支持度 署名 9 4 6 30 8 53 110 11.9% 64.8% 39.5%
未 4 0 2 1 2 1 10 1.1% 65.9% 40.1%
A同情度 署名 5 5 4 11 5 29 59 6.4% 72.3% 44%
未 6 0 5 2 3 2 18 2.0% 74.3% 45.2%
O |
|
c********a 发帖数: 23 | 18 You are right. Since lots of the textbooks use
the low pass signal to explain the sampling theorem.
That is why 抽样定理说的是至少是该信号最高频率的两倍.
However, it is not true for band pass or high pass signals.
Acctually, we should use sampling rate >= 2* bandwidth to
define the sampling theorem. |
|
q********n 发帖数: 355 | 19 为调查州内高速公路质量,以100米为一个单位进行抽检。这是一个典型的总体成数
population proportion问题。可以根据总数,合格率,置信度和精确度,推算出需要
的样本数量。如果合格率很高,需要的样本量少,如果合格率低,需要的样本量多,0.
5的合格率需要的样本量最多。
1. 实际上每个单位样本有多个检测项目,比如路面,护栏,标志,反光片等,每一个
检测项目都有一个通过率。另外,而每段路的检测项目又不尽相同。比如沥青路面和水
泥的不同,如果有桥梁,涵洞,隧道什么的又不一样。所以选取的样本要能够保证所有
可能的检测项目的数量都足够。请问有没有针对这种情况的抽样方法呢。
2. 关于是否要分区,stratified sampling,我几天前问过.但是如果每个区域内的通
过率变化不大,我用paired t-test比较过,是不是就没有必要分区了。 |
|
f*******m 发帖数: 94 | 20 请教一个 R 中随机抽样的问题
x1 <- rnorm(20)
我想从x1 中随即抽出三个数字,加上1,然后再放回到原来的位置,作为X2,请问应
该怎么做会比较好?谢谢! |
|
B*********a 发帖数: 6244 | 21 【 以下文字转载自 JobHunting 讨论区 】
发信人: Bodhidharma (达摩老祖), 信区: JobHunting
标 题: 求解一个水塘抽样题
发信站: BBS 未名空间站 (Sun Oct 4 06:31:52 2015, 美东)
处理一个stream,每一个新element都会被加入sample,sample最大size为n。假设新
element被加入之前sample的size是k,那么加入之后,以概率k/n决定是否随机去掉原
来sample里的element。如果去掉了一个,则新sample size仍为k,否则增加为k+1
问题1:第t个element在第t+r个element加入前仍在sample中的概率,假设第t个
element加入前的sample size为k。
问题2:如果最大sample size即n=10,已经处理20个element,求expected number of
elements in the sample。 |
|
p********a 发帖数: 5352 | 22 ☆─────────────────────────────────────☆
TNEGIETNI (lovewisdom) 于 (Tue Oct 11 20:01:18 2011, 美东) 提到:
朋友告诉我说他要来,还有Harvard的Carl Morris等,$200的Registration fee对我来
说不是一笔小数目。我其实并不欣赏他的bootstrap法,曾公开批评过这个方法的逻辑
错误。如果去,我跟他讲什么呢?版上的恶朋好友可否给点建议?谢谢。
☆─────────────────────────────────────☆
angelsun (安吉笋) 于 (Tue Oct 11 20:38:46 2011, 美东) 提到:
在哪里?什么时候?讲座是什么topic的?
☆─────────────────────────────────────☆
statcompute (statcompute) 于 (Tue Oct 11 23:51:23 2011, 美东) 提到:
$200 for a lecture by Efron? it i... 阅读全帖 |
|
r******y 发帖数: 39 | 23 非常谢谢回复!
Since it is fairly quick to do such simple resampling why not use a number
as big as possible?
=> 非常好的问题,也是问到了最让我头疼的地方。
1. 我这实验是过去做的,现在解释为什么选用1000作为抽样次数,没有办法回到过去
修改抽样次数
2. 如果我再重新做实验,我应该会选择更大的抽样次数,比如说5000或者10000.但即
便如此,我依然还是需要解释为什么5000或者10000是个理想的抽样次数
since the total different number of combinations is C(150, 5), any number
beyond that is not helpful).
=> 很好的见解,谢谢提示!
or you can try different runs and assess the variations between runs to
determine if 1000 is enough
=> 这步是做过了的,把1000和2000和5... 阅读全帖 |
|
T*******I 发帖数: 5138 | 24 这个standard error指的是根据这次抽样和模型假设所建立的模型参数(即beta值)的
本次抽样误差,亦即,如果以本次抽样得到的beta来估计未知总体的beta时可能发生的
一个单位的标准误差。这与用样本分布的均数估计总体分布的期望是同一逻辑。
在统计学中,任何被估计的总体参数都是由样本的一个相应统计量来估计的,因而都应
该有一个抽样误差的估计。没有抽样误差的估计仅仅是一个随机的点估计,其可信度几
乎为0,但是,一个有着抽样误差估计的统计量却是一个可信度可以达到足够高的程度
的估计。然而,关于抽样误差的估计并非有一个统一的、固定不变的方法,而是有着不
同定义,因此,任何抽样误差指的是在相应定义下的估计。定义发生改变,计算方法就
会发生改变,从而估计值就会不同。理论上,任何人都可以对抽样误差给出一个自己认
为合理的定义,但基于标准差和样本量基础上的估计是统计学史上由尼曼等首先提出的
,因此,大家基本都遵循这个逻辑来构造关于统计量的标准误的算法。这个思想的提出
在统计学史上具有划时代的意义。
beta |
|
发帖数: 1 | 25 AlphaGo相关技术:蒙特卡罗(Monte Carlo)方法简介
2016-03-13 王晓勇 算法与数据结构
来自:科学网王晓勇博客
链接:http://blog.sciencenet.cn/blog-324394-292355.html(点击尾部阅读原文前往)
AlphaGo能够成功击败专业棋手的功臣之一:蒙特卡罗树搜索(Monte Carlo Tree
Search)。
相关文章阅读:《AlphaGo背后的搜索算法:蒙特卡罗树搜索》
蒙特卡罗(Monte Carlo)方法,也称为计算机随机模拟方法,是一种基于"随机数"的计
算方法。
一、起源
这一方法源于美国在第二次世界大战进研制原子弹的"曼哈顿计划"。Monte Carlo方法
创始人主要是这四位:Stanislaw Marcin Ulam, Enrico Fermi, John von Neumann(
学计算机的肯定都认识这个牛人吧)和 Nicholas Metropolis。
Stanislaw Marcin Ulam是波兰裔美籍数学家,早年是研究拓扑的,后因参与曼哈顿工
程,兴趣遂转向应用数学,他首先提出用Monte... 阅读全帖 |
|
发帖数: 1 | 26 AlphaGo相关技术:蒙特卡罗(Monte Carlo)方法简介
2016-03-13 王晓勇 算法与数据结构
来自:科学网王晓勇博客
链接:http://blog.sciencenet.cn/blog-324394-292355.html(点击尾部阅读原文前往)
AlphaGo能够成功击败专业棋手的功臣之一:蒙特卡罗树搜索(Monte Carlo Tree
Search)。
相关文章阅读:《AlphaGo背后的搜索算法:蒙特卡罗树搜索》
蒙特卡罗(Monte Carlo)方法,也称为计算机随机模拟方法,是一种基于"随机数"的计
算方法。
一、起源
这一方法源于美国在第二次世界大战进研制原子弹的"曼哈顿计划"。Monte Carlo方法
创始人主要是这四位:Stanislaw Marcin Ulam, Enrico Fermi, John von Neumann(
学计算机的肯定都认识这个牛人吧)和 Nicholas Metropolis。
Stanislaw Marcin Ulam是波兰裔美籍数学家,早年是研究拓扑的,后因参与曼哈顿工
程,兴趣遂转向应用数学,他首先提出用Monte... 阅读全帖 |
|
a**e 发帖数: 8800 | 27 同性恋父母抚养的子女健康吗,或,你政治正确吗?
merleau
同性恋父母抚养的子女健康吗,这是一个在欧美社会科学领域中被研究超过三十年的问
题。在这里我们谈论的不是同性恋父母抚养的子女就其自身而言的健康程度,而更多的
是同性恋父母抚养的子女与传统异性恋父母抚养子女在身心健康上的差异。如果你所在
的欧美高等教育机构中开设性/别研究的课程,在这个课程上讲到queer kinship或者
gay and lesbian parenting,那么给你授课的亲自由左派老师一定会谈到这个问题,
而且他或她应该会非常肯定地告诉你这个问题的答案:没有差异。不仅仅是“没有差异
”,老师还会进一步告诉你,同性恋父母抚养的子女“更好”,因为她们的成长过程中
有更少的性别刻板印象和性向歧视,使他们能够更好地探索和发展自身兴趣与能力,这
些子女成年后与伴侣的亲密关系质量更高、吵架频率更低(Biblarz and Stacey, 2010
)。你的阅读书目里应该会有几篇社会学或心理学的定量研究,研究结论“有力”地佐
证了老师的观点。在把话题升华到“既然同性恋亲属关系具有这样的革命性和进步性,
那么他们究竟应该从... 阅读全帖 |
|
t****t 发帖数: 6806 | 28 科普一下数字通信的基本原理.
抽样定理不是在这里用的. 抽样定理是在把模拟信号抽样转换成数字时使用, 比如CD音
乐; 人耳能听到的声音在20kHz左右, 所以CD quality的音乐一般sampling rate是
48kHz或者44.1kHz(>2*20kHz).这个叫抽样定理.
FM广播本来就是模拟信号, 就是把20kHz的信号在载波上调制一下, 根本就没有抽样这
回事. 当然现在FM里掺杂了数字的side channel, 那是另一回事.
前面有人把200kHz和2.1mbps比较, 就更不对了. 抽样除了频率, 还有抽样精度的问题,
仍然以CD quality为例, 正常的CD音乐的采样率是16bit, 所以CD音乐的数据率在不压
缩的情况下, 大概是44k*16*2~=1410kbps. 另一方面, 从数字通信和信息论的角度来说
, 一定的带宽能安全地通过多少信息, 和能够做到的采样精度有直接的关系, 换句话说
, 和信噪比有关系. 所以只比较频率, 是根本不make sense的, 更不用说比较模拟信号
的带宽和数字通信的吞吐量了. |
|
a***n 发帖数: 3 | 29 我的理解:
Monte Carlo method是一般意义的随机模拟方法,它首先得抽样,再做统计计算,估
计期望。
根据抽样方式的不同,可以对monte carlo分类。如,常见的是简单随机抽样,也即iid
方式,这也就是大众理解的monte carlo方法,如用来计算PI值的积分模拟方法。当不
是iid方式,也就是说样本不独立,同分布也难定,那种类就很多,较简单的是,抽样
是对Markov Chain 特征的总体,这些样本在较短时间内不独立,但充分长时间内的样
本之间是独立的,当然前提条件是这个Markov Chain 是稳态的,也即能达到统计物理
上的平衡。对Markov Chain 抽样不能用简单的类似求PI值一样的方式,而常采用
Metropolis抽样方式,首先模拟总体生成一个满足要求的Markov Chain,再对这个链进
行抽样,再做统计计算,当然还得先对这些来自Markov Chain的样本进行关联性分析。
这种Monte Carlo方法就是Markov Chain Monte Carlo。
Markov Chain中的每个微观态只和前一个态概率关联,以其他历史态独立, |
|
c***s 发帖数: 70028 | 30 春节黄金周期间,南京路步行街上的一家老字号食品店门前排起了蜿蜒数米的长龙。 东方IC 图
2月25日,上海市商委透露,2015年春节黄金周期间,上海实现购销两旺“开门红”。据17个区县商务主管部门和百联、良友、烟糖、农工商4家商业集团联合抽样调查,412家大中型商业企业,2月11日至24日共实现营业额149.78亿元,比上年增长12.6%,年夜饭2000元左右的套餐最受市民欢迎。
412家大中型商企销售增长
从春节市场消费特点来看,节日消费高潮在节前来临,老百姓集中消费,购置年货。节前一周,抽样企业共实现营业额88.85亿元,同比增速高于节日期间。
从业态数据分析,除便利店、连锁超市,受节日期间在沪市民市场消费减少因素影响,销售略有下降之外,专业专卖及其他(包括无店铺零售)、购物中心和大卖场均实现两位数增长,增速分别为59.3%、18.4%、13.5%。
据抽样统计,浦东新区、中心区、郊区县抽样企业节日分别实现营业额8.10亿元、40.09亿元、39.82亿元,分别同比增长25.8%、13.2%、33.7%。中心区中,黄浦区以9.48亿元保持抽样企业销售规模全市第一,长宁、闸北、虹口三... 阅读全帖 |
|
z*m 发帖数: 3227 | 31 https://baijiahao.baidu.com/s?id=1640446104245127146&wfr=spider&for=pc
文:恒大研究院 任泽平 熊柴 周哲实习生周心怡等对本文有贡献
1 单纯以官方失业率等数据判断就业形势存在局限
什么是就业?根据国际劳工组织的定义,在调查参考周内为了取得劳动报酬或经营收入
而工作了至少1小时的人口,以及休假、临时停工等在职但未工作的人口,均被视为就
业人员。因此,就业形势的判断不仅需要观察总体失业率、分年龄失业率等,还需要观
察岗位空缺和求职人数比例、就业人员平均劳动时间、薪资增速、兼业比例等指标,中
国在就业统计上虽有改进,但仍存在明显问题,对真实就业形势难以充分反映。
1)城镇登记失业率依赖失业者主动前往人社部门登记,且只针对非农人口,数据波动
小,2019年二季度降至3.61%,与经济走势缺乏关联。1980年代初,中国开始建立登记
失业制度,当时称“待业统计”,1994年才改为“登记失业”。城镇登记失业率=城镇
登记失业人员/(城镇从业人员+城镇登记失业人员)。城镇登记失业人员是有非农业户
口、16周岁以上至退休年龄内、有劳... 阅读全帖 |
|
发帖数: 1 | 32 访问主题:高雄市长罢免案民调
访问时间:109 年 1 月 13 日至 14 日晚间 18:30 - 22:00
调查方法:电话后四码电脑随机抽样,人员电话访问
有效样本:1,030 位 20 岁以上高雄市民
抽样误差:95%信心水准下,抽样误差为±3.1 个百分点以内
经费来源:TVBS
韩国瑜面临罢免危机?
53%高雄市民同意罢免韩国瑜,32%不同意,8%不去投票,7%没意见
2020 总统大选落幕,国民党韩国瑜竞选失利,选后销假回归市政,上班首日召开记者
会,强调农曆年节将至,市府团队务必维护治安、稳定物价、整洁环境,专心高雄市政
,并针对请假参与总统选举暂离高雄,公开向高雄市民道歉。另一方面,高雄民间团体
发起罢免韩国瑜行动持续进行,若第二阶段连署通过,估计最快五月份进行罢免投票。
根据 TVBS民调中心最新调查结果显示,有过半(53%)高雄市民表示同意罢免,比例高
于不同意罢免的 32%,8%表示不会去投票,另外 7%没有表示意见。
20-29 岁市民 71%同意罢免高雄市长韩国瑜;50-59 岁则有 47%不同意,42%同意
交叉分析显示,
20-49 岁青壮年有半数以上同... 阅读全帖 |
|
k**k 发帖数: 214 | 33 http://fangzhouzi.baijia.baidu.com/article/645903
方舟子 10月04日 09:43
今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里
赢,27%认为川普赢,据此可以说希拉里大获全胜。
但是网上有很多对这次辩论结果的投票,有的票数几十万、几百万,都是一面倒地认为
川普赢。川普就因此宣布自己赢了,说除了“没人看的CNN”,所有的“民意调查结果
”都是他赢得了辩论,... 阅读全帖 |
|
o***s 发帖数: 42149 | 34 昨晚,大豆腐巷胡同一处冷饮批发部,工商等部门人员突查“瑞华牌老冰棍”。
炎热夏日里,在前门、王府井地区,一元钱一根的“老冰棍”深受游客喜爱。近日,记者接到报料,一种名为“瑞华老冰棍”每日销售约5万根,但质量存在隐患。记者向权威检测机构送检一批“瑞华”牌的“老冰棍”,检验报告中“菌落总数”和“大肠菌群”分别超标约1767倍和240倍。
昨日,记者向北京市食品办通报此事。当晚,顺义区食品办、工商、质监等部门突击检查北京瑞华冷饮厂,抽样检测并将仓库封存。执法人员表示,在检测结果出来前将暂停生产。
“大肠菌群”超标约240倍
5月15日上午10点,记者从南池子附近小卖部购买一箱(48根)“瑞华牌老冰棍”,生产日期为2012年4月1日。
记者未动包装,将这箱冰棍用棉被包裹,送至北京市某权威检测机构进行检测,并签署了相关委托检验手续。
5月17日下午,该机构出具检验报告。检验报告中,样品数量“1份10个”,样品状态“完好”。检验结果中,“菌落总数”为5300000cfu/ml,“大肠菌群”为24000mpn/100ml,“甜蜜素”为0.91g/kg,“糖精钠”为0.27g/kg。
按照国家发布的《... 阅读全帖 |
|
r***s 发帖数: 2 | 35 以上回复,好象没有一个是对的。
计算“五连号”的概率一定要弄清楚“五连号”的定义。根据那科长的话:“这个“五
连号”不是一口气出现的,是不同的人在不同时间段摇出的结果,还有许多是三连号”
。由此可看出“五连号”的意思是从1到786的某位数在203次抽样中出现5次,并没有要
求连续出现。据此,我们可以计算至少出现一次“五连号”或大于“五连号”的概率如
下:
(1)从1到786任意一个数,比如1号,那么1号在203次抽样中,每次被抽到的概率是1/
786 (抽样是放回式抽样,否则不可能出现连号);
(2)1号在203次抽样中被抽到的总次数X服从二项分布,bin(203, 1/786);
(3)P(X>=5)=1-P(X<5)=1-(P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4))=1-(C203(0)*(1/
203)^0*(202/203)^203+....)=7.390808e-06;
(4)因为1-786,每号是平等的,所以至少出现一次“五连号”或大于“五连号”的概
率是:786×7.390808e-06=0.005809175 |
|
z****e 发帖数: 54598 | 36 来来来,卡亚可桑,这是大师的挑战贴,麻烦你点评一下
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 如果你不是孬种数学背景出来搞统计的,请接受挑战
发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱,我想请seattleren, ningyan, kaleege,marole(haha),NYHuan(无敌小
欢)以及Jasonlin (legendary)等人接受我的挑战。当然,这份被邀请者名单是开放的,
我将根据版上的动态随时更新。我也欢迎任何人参与严肃的讨论。不能说出个一二三四
的,就请自动回避,免得自讨没趣(我想对pp65说的是,我对你感到抱歉,因为本段最
后的话对... 阅读全帖 |
|
t*****g 发帖数: 6101 | 37 为什么?因为现在找到一个家人或者亲友里出了一个车祸的人,和找到一个当年家人或
者亲人饿死的人,是一样困难的,不信么?那你找找看?找到这件事情就体现了一个概
率统计上的抽样检验。
当然,当年三年饿死的人数达到现在一年的车祸的人数,也说明情况是很严重的,甚至
也可以说人的生命是宝贵的就是饿死一个人也是不应当的,也是应当检讨工作的失误的。
但是,当年的饿死人是有一定的人为性,当然也有自然灾害的因素,但主要还是帝国主
义的经济封锁造成的,因此是帝国主义的滔天罪行。因为,一国因这样或者那样的原因
粮食减产这很正常,从其它地方进口粮食既可。但是,当一国无法借债,自己印的钞票
帝国主义又不承认,在没有钱的情况下,加上帝国主义拒绝提供轮船使用的石油,粮食
运不过来,这样就导致了粮食特别紧张。
还有一个重要因素就是马尔萨斯人口周期论,这个周期论,马克思主义是不承认的,但
我是右派,我认为它对。就是说,人口呈几何级数增长,而产量呈算术级数增长,因此
当人口增长过快的时候,就产生饥荒,这并不怪产量没有增加,只不过,在不可再生性
能源,石油的大量使用之前,光凭人力和畜力,产量的增加就是呈算术级数增长的。正
因... 阅读全帖 |
|
a****r 发帖数: 12375 | 38 连云港某校五学生相继患白血病,校方:暂与水质无关
澎湃新闻记者 刘楚
2015-12-14 20:28 来自 长三角政商
近日,一些微信公众号发布文章,称位于江苏连云港的淮海工学院
“已经有5名学生因白血病死亡,可能与学校水质严重污染有关”的内容。
12月14日,澎湃新闻(www.thepaper.cn)从多个官方渠道获悉,上述
传言有所不实。官方确认,最近两年,淮海工学院确有5名在校学生或
毕业生先后患上了白血病,其中两人死亡。
目前,官方已组织权威机构对该校供水管网的水质进行了抽样检测,
其中第一次的检测结果是水质符合国家生活饮用水卫生标准。12月11日,
连云港市疾病预防控制中心安排专人对淮海工学院的饮用水再次进行
抽样检测,检测结果将于近期发布。
淮海工学院是一所位于连云港市的江苏省属高校。今年12月初开始,
该校多名学生在包括微博、微信、贴吧等社交网络上发言,声称该校
一个月内连接有两名学生因白血病去世。学生们对该校的水质表示
担忧,并贴出了相关照片。
12月10日,淮海工学院团委在其官方微博@淮海工学院团委 发布微博,
表示针对“淮海工学院的学生患白血病疑与学校水质有关内容... 阅读全帖 |
|
发帖数: 1 | 39 近日,日本第三大钢铁企业神户制钢大规模造假丑闻浮出水面。且事态持续升级,影响
范围不断扩大,到目前为止,被坑企业已达500家!其中,不乏波音、空客、丰田、三
菱等多家世界500强企业。日本制造走下神坛,不再是神话。
其实,早在十多年前的2000年,中国的三峡工程就差点被日本钢铁坑了。事情经过是怎
样的呢?我们来看一篇由人民日报社主管、主办的大型时政综合性半月刊《大地》杂志
在2000年发布的旧文。
《特写:三峡工程首例对日索赔纪实》全文如下:
一
2000年5月8日上午,湖北出入境检验检疫局驻三峡工程办事处检验员王春来正在当班,
接到三峡工程开发总公司下属国际招标有限公司来人的报验:“从日本进口的一批热轧
钢板到货了,请求尽快检验。左岸电站工地最近就要投入使用。”
据介绍,这批钢板主要是用来制作直径12.4米的引水钢管,直接相连于左岸7-14号水轮
发电机组的蜗壳部位,将被浇筑在混凝土坝身上永久使用。三峡工程有关专家说:“这
是承接三峡工程心脏的主动脉血管,直接关系到三峡工程的内在质量,业主上上下下都
很重视。特别是承受着来自库内393亿立方米水形成的几十万吨、甚至是几百上千万吨
的强... 阅读全帖 |
|
M******8 发帖数: 10589 | 40 http://finance.qq.com/a/20171017/005997.htm
日本钢铁造假惊人:2000年三峡工程差点被坑
人民网黄宏章2017-10-1706:11
编者按:近日,日本第三大钢铁企业神户制钢大规模造假丑闻浮出水面。且事态持续升
级,影响范围不断扩大,到目前为止,被坑企业已达500家!其中,不乏波音、空客、
丰田、三菱等多家世界500强企业。日本制造走下神坛,不再是神话。
其实,早在十多年前的2000年,中国的三峡工程就差点被日本钢铁坑了。事情经过是怎
样的呢?我们来看一篇2000年的旧文。
本文原刊于是由人民日报社主管、主办的大型时政综合性半月刊《大地》杂志(2000年
第二十期),作者:黄宏章。
《特写:三峡工程首例对日索赔纪实》全文如下:
一
2000年5月8日上午,湖北出入境检验检疫局驻三峡工程办事处检验员王春来正在当班,
接到三峡工程开发总公司下属国际招标有限公司来人的报验:“从日本进口的一批热轧
钢板到货了,请求尽快检验。左岸电站工地最近就要投入使用。”
据介绍,这批钢板主要是用来制作直径12.4米的引水钢管,直接相连于左岸7-14号水轮
发电机组... 阅读全帖 |
|
s*****t 发帖数: 1661 | 41 当时的poll比现在密集得多。
你看专门讲抽样的教材,里面都拿这个做反面例子,说抽样再多,抽得不好还是个屁。
杜鲁门之后一直到“现在(写书当时)”, 你看我统计抽样多光辉正确啊。找到问题
后再也没错过啊, 呵呵。
我是大概十年前读的。
不知道今年这么搞之后,会不会又一次坏了统计的名声。严格来说,不是统计的错,很
多抽样违反抽样101的规则。但是谁知道后人会怎么写书怎么说呢。。。 |
|
l***a 发帖数: 12410 | 42 【 以下文字转载自 Statistics 讨论区 】
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 如果你不是孬种数学背景的统计学家,请接受挑战
发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱,我想请seattleren, ningyan, kaleege等人接受我的挑战。当然,我也欢
迎任何人参与严肃的讨论。不能说出个一二三四的,就请自动回避,免得自讨没趣(我
想对pp65说的是,我对你感到抱歉,因为本段最后的话对你来说说得太晚了)。
给定一个两分法的样本(假定X是自变量而Y是因变量,两段都是简单线性模型,且临界
点是在X上)。现行算法及分段模型组的基本表述如下:
... 阅读全帖 |
|
c**********n 发帖数: 227 | 43 control只是统计抽样的一个小进步而已,看你如此迷信control基本断定你没有系统学
过统计学,或者说对统计学的理解很偏面。
决定检验结果的因素有重要几条。
1。样本空间,也就是说,样本越充足结果越可靠,而你不可能对所有人进行药检对不?
自然会影响结果可靠性。
2。抽样的设定,这步算是关键一步,抽样设定得越合理,结果越接近真实。但是我告
诉你,目前西医的抽样设计漏洞仍然不小,但是通过深入研究中医中国文化你的思路会
得到扩展,可以设定更为合理的抽样步骤,估计能提高对西药检验的可靠性。具体的,
我故意卖个关子,毕竟这里埋伏不少为西药厂工作的探子。
3。什么t检验这些都是统计学的基础,深入点,影响判断事物相关性的会涉及很多主观
因素,也就是说,你在发现新物质的过程中会融入很多主观的判断。即使两者之间的相
关系数很高,只要不是100%也就是说两者是有差异的,而导致两者相关的很可能有其他
未知因素,如果不能找到这个最终导致两者相关的因素,那么你的结果就存在隐患。举
个简单的例子,拿欧洲人作样本确定某两因素相关,而导致两者相关的因素是饮食结构
,如果你没有发现这个关键性因素,直接把结果运用到 |
|
o****e 发帖数: 80 | 44 有一个rv x,mean ux, variance dx; 还有一个rv y, mean uy, variance dy; x and
y 相互独
立。
现在从x和y中各抽样50,000个,你能不能从抽样中判断x和y的期望值是否相同?
我的答案,是用大数定理,抽样的平均值逼近rv的期望值,所以如果两个抽样的均值相
等,就说明x和y 的期望值相同。
interviewer: 如果两个抽样的均值分别是10.00000000082 和 10。000000000078,你
认为期望值相同吗?
我就歇菜了。。。
我的简历上根本没有claim统计,为什么揪着统计不放,呜呜呜 |
|
T*******I 发帖数: 5138 | 45 看来,在那些抽象的概念上纠缠永远不能有结果。让我说得具体一点。
给定一个两分法的样本(假定X是自变量而Y是因变量,两段都是简单线性模型,且临界点是在X上)。现行算法及分段模型组的基本表述如下:
hat\y_1 = a1+b1X if X<=t
hat\y_2 = a2+b2X if X>t
ID X Y M CR
1 x1 y1 m1 cr1
2 x2 y2 m2 cr2
3 x3 y3 m3 cr3
4 x4 y4 m4 cr4
5 x5 y5 m5 cr5
6 x6 y6 m6 cr6
7 x7 y7 m7* cr7 min(.)
8 x8 y8 m8 cr8
9 x9 y9 m9 cr9
0 x0 y0 m0 cr0
其中,M是由分段模型组的系数构成的矩阵,CR是分段模型的合并残差。*表示根据最小
CR选定的分段模型,如果我们有 ... 阅读全帖 |
|
T*******I 发帖数: 5138 | 46 这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱,我想请seattleren, ningyan, kaleege等人接受我的挑战。当然,我也欢
迎任何人参与严肃的讨论。不能说出个一二三四的,就请自动回避,免得自讨没趣(我
想对pp65说的是,我对你感到抱歉,因为本段最后的话对你来说说得太晚了)。
给定一个两分法的样本(假定X是自变量而Y是因变量,两段都是简单线性模型,且临界
点是在X上)。现行算法及分段模型组的基本表述如下:
hat\y_1 = a1+b1X if X<=t
hat\y_2 = a2+b2X if X>t
ID X Y M CR
1 x1 y1 m1 cr1
2 x2 y2 m2 cr2
3 x3 y3 ... 阅读全帖 |
|
f*******e 发帖数: 2791 | 47 http://club.china.com/data/thread/1011/2720/60/42/8_1.html
福建多部门联合发文 禁止转 基 因大米在省内销售
2010年12月03日 09:29:42 来源: 东南新闻网
福建省粮食局、福建省食品安全委员会办公室、福建省农业厅和福建省工商行政管
理局日前联合下发《关于加强转基因大米监管的通知》,通知称今年来我省陆续接到市
场销售转基因大米的报告,目前社会各界对转基因大米的安全性及潜在风险存在争议,
我国尚未批准转基因水稻进入商业化生产,为确保人民群众大米食用安全,我省要求各
环节严查转基因大米。
我省要求各地增强转基因大米监管重要性的认识,转基因大米是指利用基因技术生
产的水稻加工而成的产品,目前社会各界对转基因大米的安全性及潜在风险存在争议。
根据我国的相关规定,转基因水稻生产需要获得农业部颁发的转基因安全证书,并通过
品种审定,获得种子生产许可证和种子经营许可证后,方可进入商业化生产。不过迄今
为止,我国还没有组织转基因水稻品种鉴定,尚未批准转基因水稻进入商业化生产。私
自种植、加工和销... 阅读全帖 |
|
b*****d 发帖数: 61690 | 48 日本遭放射性铯污染牛增至578头
http://www.sina.com.cn 2011年07月18日21:33 人民网
人民网东京7月18日电(记者于青)据NHK电视台报道,18日从福岛县和新泻县查明进
入流通环节的“铯牛”435头,加上截至17日查明的“铯牛”143头,迄今进入日本国内
近40个都道府县流通环节的“铯牛”增至578头。福岛县从18日开始对县内所有4000家
养牛农户进行入户调查。宫城县也开始对县内900多家专业养牛农户进行问询调查。
福岛县政府18日发布消息称,新查明县内有7家肉牛养殖户给牛喂食了被放射性铯
污染的稻草。据悉,这7家养殖户的共411头牛已经出货。7家中包括郡山市2家及本宫市
等地养殖户。其中2家使用的稻草来自宫城县、福岛县内被测出铯的稻草农家。411头肉
牛的详细出货数据为:东京都199头、兵库县192头、群马县9头、福岛县8头、栃木县2
头、埼玉县1头。从本宫市养殖户使用的稻草中检测出的铯强度为每公斤69万贝克勒尔
,刷新了最高值。福岛县政府要求这7家养殖户尽量不要销售或移动肉牛,并禁止其继
续喂稻草。
日本国内最初发现“铯牛”问题是7月8日在... 阅读全帖 |
|
w*********g 发帖数: 30882 | 49 同时质问金龙鱼:
(1)你们对自己加工抗草甘膦转基因大豆生产的金龙鱼转基因大豆油,是否对孟山
都抗草甘膦转基因大豆中必然存在的活的转基因片段进行了检测?
(2)如果进行了检测的话,检测的结果如何?为什么不向消费者告知来自抗草甘膦
转基因大豆的这种转基因片段对人类健康,特别对青少年、儿童、婴儿与孕妇及其胎儿
,造成一系列危害?
陈一文:转基因大豆脂肪酸含量比非转基因大豆的低不利健康
http://blog.sina.com.cn/s/blog_4bb17e9d0102dr56.html
国内学者检测发现:抗草甘膦转基因大豆的脂肪酸含量比非转基因大豆的低。食用
油脂的营养价值较大程度是取决于它的脂肪酸组成及其配比。中国优质非转基因传统大
豆油ω-6和ω-3脂肪酸的含量都较高。国外学者发现:抗草甘膦转基因大豆大量施用草
甘膦导致转基因大豆ω-6和ω-3脂肪酸的含量下降,对健康不利!深圳市计量质量检测
研究院对金龙鱼转基因大豆油的脂肪酸含量,特别是ω-6和ω-3脂肪酸含量,进行检测
了吗?与中国优质非转基因大豆相比的检测结果如何?
“抗草甘膦转基因大豆的脂肪酸含量比非转... 阅读全帖 |
|
b*****d 发帖数: 61690 | 50 新浪财经讯 9月6日消息,今日欧盟委员会宣布对华光伏组件、硅片、电池等产品发
起反倾销程序。业内认为,今年在美国上市的多家中国光伏企业财报表现不佳,欧洲反
倾销立案又雪上加霜,大全(NYSE:DQ)、尚德(NYSE:STP)等中概股面临退市风险,一些
企业已悄然发起退市程序。(在美上市光伏中概股一览)
分析称欧盟反倾销税率高于30%
欧盟委员会在公告中称,反倾销调查的产品为光伏组件、硅片、电池等,范围较美
国有所扩大,国内数百家企业牵涉其中。按照反倾销的程序,欧盟下一步将会根据企业
规模、出口数量、出口金额等选举抽样企业,这些抽样企业将会享有单独的反倾销税率。
英利法务总监陈卓称,按照出货量,英利应该是对欧洲出口规模最大的企业,因此
很有可能成为抽样企业之一。英利也在立案消息发布之后,第一时间发表声明,称“我
们将密切配合欧盟委员会的调查,证明中国光伏企业在欧洲不存在倾销行为”。
过去欧洲选取抽样企业一般是2至3家企业,不过,陈卓称目前得到的消息是,欧盟
此次可能会选择5至6家企业作为应诉企业。
这与中国光伏产品涉及规模有关。数据显示,2011年,中国出售了约210亿欧元(合
264... 阅读全帖 |
|