e****e 发帖数: 677 | 1 对于二项式分布的置信区间,我有两种理解
1 就是假设观察到的概率为p,从而推出理想状况某confidence level下的概率的置信
区间为[p-a1,p+a2]
比如
2 就是已知理想状况的概率为p,但是实际测量后某confidence level下得到的概率的
置信区间为[p-a1,p+a2]
哪种理解是对的? |
|
发帖数: 1 | 2 随手google到的,将就看下
刘仲敬:节点学
云远
来自: 云远 2017-05-20 20:01:34
历史在chaotic point附近失效,涨落决定系统分岔……
节点可以预测,分岔不可预测。世界是无穷多分岔的路径积分,薛定谔状态在节点破裂
。裴迪南大公没有中弹的世界一直存在,只是位于概率云的稀薄部分。黑天鹅通过
baker transformation,将涨落引向相变。
经典路径是复数bernoulli systems当中易于辨识的单个子系统,在子系统内部可以预
测,在系统分岔时不可预测,通过确定性跳跃将记忆输入系统。
各自表述学实际上是一个失败的相变,也就是概率云未能进入亚稳态,但即使成功的相
变也不可能形成真正稳定的概率云,只是将概率疲劳的时间线拉长到超过人类集中注意
力的平均水平而已。优秀的棋手都有同时仿真多路径的能力,仿真库大小与其造诣成正
比。所以两者没有真正的差别,都只需要简单确定的规则。
谢林哲学所谓的潜在可能性单元,需要适当的实验窗口。各自表述学在秩序生成树当中
的地位,就是医生最喜欢的那个猎枪打穿的胃。平时隐藏在黑暗中的蠕动,这时就暴露
在光天化日之下了。
... 阅读全帖 |
|
发帖数: 1 | 3 随手google到的,将就看下
刘仲敬:节点学
云远
来自: 云远 2017-05-20 20:01:34
历史在chaotic point附近失效,涨落决定系统分岔……
节点可以预测,分岔不可预测。世界是无穷多分岔的路径积分,薛定谔状态在节点破裂
。裴迪南大公没有中弹的世界一直存在,只是位于概率云的稀薄部分。黑天鹅通过
baker transformation,将涨落引向相变。
经典路径是复数bernoulli systems当中易于辨识的单个子系统,在子系统内部可以预
测,在系统分岔时不可预测,通过确定性跳跃将记忆输入系统。
各自表述学实际上是一个失败的相变,也就是概率云未能进入亚稳态,但即使成功的相
变也不可能形成真正稳定的概率云,只是将概率疲劳的时间线拉长到超过人类集中注意
力的平均水平而已。优秀的棋手都有同时仿真多路径的能力,仿真库大小与其造诣成正
比。所以两者没有真正的差别,都只需要简单确定的规则。
谢林哲学所谓的潜在可能性单元,需要适当的实验窗口。各自表述学在秩序生成树当中
的地位,就是医生最喜欢的那个猎枪打穿的胃。平时隐藏在黑暗中的蠕动,这时就暴露
在光天化日之下了。
... 阅读全帖 |
|
l*******s 发帖数: 7316 | 4 这里有一般性的有限制条件的采样方法。
http://stats.stackexchange.com/questions/30564/generating-rando
针对原LZ的问题,我来给个采样方法。
n个[0,c_n]之间的随机数 x_1,x_2,...x_n,要求x_1+x_2+...+x_n=c_n,
这n个随机数有相同的分布。
x_1+x_2+...+x_n=c_n 这个限制条件把采样空间从n维空间,变成了n-1维空间(或称为
n-1维超平面)。 假设要求采样在这n-1维空间里均匀分布。(这个假设大概最符合原
意)。
那么 y_n=x_1+x_2+...+x_(n-1) 这个在[0,c]之间随机数的概率分布应该是跟x_1+x_2
+...+x_(n-1)=y_n 在前面的n-1维超超平面上的面积呈正比。
PDF: f(y_n)= (n-1)/c_n * (y_n/c_n)^(n-2)
CDF: F(y_n)= (y_n/c_n)^(n-1)
所以在[0,1]之间均匀概率随机产生z_n,
然后由以下方法计算y_n 和 x_n
y_n=c_n*z_n^(1/(n-1))
x_n=... 阅读全帖 |
|
t*****l 发帖数: 39 | 5 【 以下文字转载自 Mathematics 讨论区 】
发信人: terrynl (竟然无言以对), 信区: Mathematics
标 题: 请教概率高手
发信站: BBS 未名空间站 (Sun Aug 5 15:38:32 2007), 转信
已知某分布P
从这个分布里抽取n个(n non-negative integer)互相独立的随机变量,
他们的和服从啥分布?
thx~ |
|
A*******y 发帖数: 1610 | 6 此文大谈逻辑和分析,转给各位在GRE or GMAT的逻辑题身经百战的各位佛爷瞅瞅~
============分割线===================
(觉得本文实在太长又没有时间的,可以只看倒数第二章节)
本文由新浪@破破的桥撰写,欢迎大家指正。文章篇幅很长,很长,仔细读完大概需要
一个小时,不太适合网络上的快餐式阅读。但读完这篇,天涯凯迪那种几十个马甲水军
们使吃奶劲儿刷版盖楼的帖子就不必看了。如果你的智力正常,又比较理性。本文大致
可以回应(当然不是说服)绝大部分的质疑。但是,本文的主要目的并不在于回应质疑
,而是说明这些质疑产生的原理,为什么会有人信有人不信。所以,如果你是个关注方
韩大战的人,花这点时间还是值得的。由于本文图片很多,建议大家看博客而不是长微
博。鸣谢@密商 整理证据证人。
按理,传播至此,阵营应该不会有啥变化了。首先回应方也没有什么新证据出来了,质
疑方也没啥新手段了。依靠不断地自我暗示和心理反馈,信者恒信,疑者恒疑,人们对
反向信息应该早已完全油盐不进。所以如果有哪些朋友不同意我观点,却能读完本篇,
我在此额外表示感谢。
在讨论之前,首先分离问题,讨论的... 阅读全帖 |
|
s*****e 发帖数: 21415 | 7 电子的空间分布本身就是以概率波的方式分布呀。
换句话说电子在空间的坐标是一个概率分布。 |
|
h*******y 发帖数: 304 | 8 有大量图片,直接点链接吧。
无脑教徒直接略过宣布铁证和胜利去吧。
http://blog.sina.com.cn/s/blog_56fc0caa010109ek.html
本文由新浪@破破的桥撰写。欢迎大家指正。文章篇幅很长,很长,仔细读完大概需要
一个小时,不太适合网络上的快餐式阅读。但读完这篇,天涯凯迪那种几十个马甲水军
们使吃奶劲儿刷版盖楼的帖子就不必看了。如果你的智力正常,又比较理性。本文大致
可以回应(当然不是说服)绝大部分的质疑。但是,本文的主要目的并不在于回应质疑
,而是说明这些质疑产生的原理,为什么会有人信有人不信。所以,如果你是个关注方
韩大战的人,花这点时间还是值得的。由于本文图片很多,建议大家看博客而不是长微
博。
按理,传播至此,阵营应该不会有啥变化了。首先回应方也没有什么新证据出来了,质
疑方也没啥新手段了。依靠不断地自我暗示和心理反馈,信者恒信,疑者恒疑,人们对
反向信息应该早已完全油盐不进。所以如果有哪些朋友不同意我观点,却能读完本篇,
我在此额外表示感谢。
在讨论之前,首先分离问题,讨论的是“韩寒的作品有人代笔”,而不是“韩三篇和时
政评论写得很臭”,“... 阅读全帖 |
|
p********r 发帖数: 1465 | 9 忽悠的原理和技巧——以对韩寒《求医》一文的分析为例
(觉得本文实在太长又没有时间的,可以只看倒数第二章节)
本文由新浪@破破的桥撰写,欢迎大家指正。文章篇幅很长,很长,仔细读完大概需要
一个小时,不太适合网络上的快餐式阅读。但读完这篇,天涯凯迪那种几十个马甲水军
们使吃奶劲儿刷版盖楼的帖子就不必看了。如果你的智力正常,又比较理性。本文大致
可以回应(当然不是说服)绝大部分的质疑。但是,本文的主要目的并不在于回应质疑
,而是说明这些质疑产生的原理,为什么会有人信有人不信。所以,如果你是个关注方
韩大战的人,花这点时间还是值得的。由于本文图片很多,建议大家看博客而不是长微
博。鸣谢@密商 整理证据证人。
按理,传播至此,阵营应该不会有啥变化了。首先回应方也没有什么新证据出来了,质
疑方也没啥新手段了。依靠不断地自我暗示和心理反馈,信者恒信,疑者恒疑,人们对
反向信息应该早已完全油盐不进。所以如果有哪些朋友不同意我观点,却能读完本篇,
我在此额外表示感谢。
在讨论之前,首先分离问题,讨论的是“韩寒的作品有人代笔”,而不是“韩三篇和时
政评论写得很臭”,“媒体过度拔高或消费韩寒”,“韩寒被神话... 阅读全帖 |
|
K*****2 发帖数: 9308 | 10 你俩的a和b定义是反的,1/3到4/9是白人的,0到1是华人的
这题里面没有有效观测,可以假设均匀分布也可以随便假设别的分布,比如beta分布,
所以没有一定的关于a>b概率的结论 |
|
p*e 发帖数: 6785 | 11 与坑王探讨,看看这篇论文的理论是否过时。
发信人: wivi (丫头), 信区: Automation
标 题: 挖坑与灌水的科学分析(zz)(转载)
发信站: 饮水思源 (2002年11月14日23:28:59 星期四), 站内信件
【 以下文字转载自 joke 讨论区 】
【 原文由 wivi 所发表 】
发信人: bloodemon (蝉,没啥好玩的,玩命吧), 信区: Joke
标 题: 挖坑与灌水的科学分析(原创)
发信站: BBS 水木清华站 (Thu Nov 14 13:38:16 2002), 站内
挖坑与灌水的科学分析
(On luring and watering -- A quantitative approach)
bloodemon, [email protected]
/* */
SNWA(SMTH Net Worm Association) Senior Member
SWA(SMTH Watering Association) Member
摘要:
挖坑与灌水一直是smth上网虫和水虫们关心的焦点,如何挖出“绝世好坑”(JSHK),
如何... 阅读全帖 |
|
o*******w 发帖数: 349 | 12 我们知道微分方程
du/dt = f(u)
{ -------- (1)
u(0) = u0 初始条件
有唯一解, 如果 f 足够光滑。
所谓唯一解也可以表达为解对初始条件连续
(i.e. if | u0' - u0 | < Δ, then | u(t)' - u(t) | < L*Δ, given the same f)
现在有
d E{U(t+1)} = f (u(t)) 这跟上面的(1)在形式上差不多, 但这里U(t+1)是一个随
机变量,其变化范围是 O(1), 比如 Poisson 分布
因此 u(t) =(1/N) * [ U(0) + U(1) + ... U(t) ] , scaled U(i), 也是一个随机
变量。U(0) + U(1) + ... U(t) 满足 concentrating 的条件,也即
以很高的概率在它的均值周围变化(formally, 可参考large deviation theory, 或... 阅读全帖 |
|
|
m**********e 发帖数: 220 | 14 【 以下文字转载自 Quant 讨论区 】
发信人: mademoiselle (ruru), 信区: Quant
标 题: 概率题
发信站: BBS 未名空间站 (Sat Mar 30 08:46:37 2013, 美东)
从n张不同的牌中随机抽取一张牌,抽到之后再放回,这样一直抽到跟前面的牌有重复
的为止。记随机变量Tn为抽过的次数,那么n趋向于无穷的时候,Tn/sqrt(n)趋向于什
么分布?是依分布函数收敛
是有名字的分布吗?
这是个经典问题吗?
谢谢。。 |
|
i*******D 发帖数: 993 | 15 谢谢回复. 我觉得如果疏通不需要时间的花,你说的方法可以选出在赌塞k前最大流量的
策略. 但是注意疏通也是要全系统停止花时间的. 你要做出一个在堵塞了i个管道后,它
继续这样堵着和你花一定时间疏通哪个接下来的预期更加好的决定.这时候要比较它们
的预期就要先算出疏通之后的预期.而你假定你疏通之后也会继续按照这个策略在堵塞
时候疏通. 因此很难写出一个不涉及递归的表达式出来. 是不是先把时间看作一段一段
的,求出一个表达式,然后再取时间的极限?
假设每个管道的堵塞在单位时间内概率密度符合泊松分布是指每个管道在单位时间内单
个堵塞事件都是独立分布的且具有同样的时间密度, 这个不是类似一般的电话占线问题
等随机发生事件的典型分布吗?
, |
|
发帖数: 1 | 16 中国的中高端产业分布和大城市房价探讨
文章来源:宁南山
在五十四年前,也就是1964年,中国做出了一个决定,那就是搞三线建设,原因也
很简单,外部有国际政治军事形势压力,而内部发展存在马太效应。
1964年,中国中央政府一盘点全国的工业,发现“工业过分集中。全国14个百万人
口以上的大城市,就集中了约60%的主要民用机械工业和52%的国防工业”。
到了2018年,这个情况有了很大改善,
但是中国的中高端产业和工作机会,仍然集中在4+7个城市,
4个城市就是一线城市北京,上海,广州,深圳。
7个城市是:成都,重庆,天津,武汉,杭州,苏州,南京
没错,我写下这11个城市的名字的时候,没有去查任何数据,仅仅是写出国人心目
中较为公认的,存在大量中高端产业和工作机会的城市。
然后我查询了2017年的全国城市GDP排行榜,这11个城市刚好就是全国前11位,GDP
占了全国的四分之一,高达25.22%。
在这11个城市以外,还有一些中高端产业发展很快的明星城市,最为典型的就是西
安,郑州,合肥,东莞,这四个城市GDP总量都在全国前25位,但是总体而言,虽然发
展快,但这四个城市体量还比较小,最大的... 阅读全帖 |
|
C***U 发帖数: 2406 | 17 前面说的解法是对的 不过说的不是很严谨
假设x_i是收集第i个小礼物所需要的次数的随机变量,那么你的问题就是求x=sum x_i
的期望。在已经收集到i-1个小礼物的情况下,再收集一个新礼物的概率是n-i+1/n。然
后这里要用到的一个性质是x_i都是几何分布的。几何分布随机变量的期望就是收集到
新礼物的概率的倒数。
所以Ex=Ex_1+...+Ex_5=5/5+...+5/1。 |
|
o****r 发帖数: 132 | 18 通俗的讲,就是各种可能性都有:涨,跌或走平。
当然,从概率统计的角度,可以进行计算分析,知道其大致的概率分布规律。
当你的系统的损益符合这种概率分布时,你就可以持续稳定赚钱了。
建议研究一下赌场或保险公司的盈利模式,你会有所启发。 |
|
x**h 发帖数: 173 | 19 很有意思的观点. 我可以理解两种分布Entropy的不同. 可是likelihood不一定有差别.
李古棋逢对手,40盘打成20比20. 看来,每人赢一盘的实际概率都是50%. 这样,总盘数
为奇数,不同的分布Likelihood会有不同;否则,likelihood应为相同. 当然,我没有考虑
连续两盘的条件概率.
这样看来,likelihood和entropy的关联可能需要一定限定.
probability |
|
|
E*******e 发帖数: 1371 | 21 区别就在这个地方
按照牛顿力学,状态(比如位置、速度等等)都是确定的量,那么有了确定的初状态(
这个似乎是必然的),以后任何时候的状态都是唯一确定的。这个就是宿命论。然后围
绕着承认不承认或者相信不相信宿命,一堆唯心主义唯物主义宇宙有限主义宇宙无限主
义的文青二青争论得不亦乐乎。
然后量子力学出现以后,告诉你们,所谓的态,是一些参数(比如位置速度等等)的概
率分布。就算你们按照上面一段的逻辑,觉得以后任何时候的态都可以算出来,即使这
样,因为系统的复杂性,较长时间以后的结果将是纠缠得非常厉害的状况,各个本征态
的概率往往是趋同,也就说各种可能的物理量观测值的概率是差不多的。简单的说,就
是这个结果没啥意义。
举个例子,按照完全的牛顿力学观点,你二十年以后的某个时刻,是死的还是活的这个
问题的答案,已然是被现在这个世界的状态所唯一确定了--这个就是宿命论。按照量
子力学的话,就算当前世界的所有量子态(概率分布)都是确定的,计算你二十年后是
死是活,结论就是百分之几十死百分之几十活,这个还有个毛的宿命啊。 |
|
Y**u 发帖数: 5466 | 22 ☆─────────────────────────────────────☆
heyes (hoooyou) 于 (Fri Aug 12 13:21:56 2011, 美东) 提到:
佛就是佛,道就是道,是修生养性,和人生和哲学扯扯还行。
不要再和什么爱因斯坦,量子力学,薛定谔猫啊狗的瞎联系了,好不好?再这么下去,
你们要把人类所有的光辉成果都给吞食到佛的肚子里了,还怎么个这个空空,那个空的
呢?这种文章都mark实在太。。。佛告诉我,沉默是真空。所以我就不沉默了。
如果你们硬要扯人类的光辉思想是佛早就知道的,我来问你们那些自以为懂猫啊狗的一
个问题。回答这个问题不是你们那种马后炮就可以蒙混过去的,要真刀真枪干的。
哦,老爱已经做了相对论了,你们偷过来这么一说,就成佛的“预见”了?人物理学家
辛辛苦苦几代搞的量子力学,你这一猫啊狗的一吹,就又成佛“早就知道”的了?蛋不
是这么扯的,慧根不是这么修炼的吧?
好吧,问题来了,很简单。
“请问人能不能回到(时间)的过去?”
请给出佛的答案,看看佛会不会早已经预料到了物理学家的“光辉思想”(以后或者将
来,或者佛说没有过去,现在和未... 阅读全帖 |
|
j*****h 发帖数: 62 | 23 【 以下文字转载自 EE 讨论区 】
【 原文由 jiangch 所发表 】
假如我有n个随机过程X_1(t), X_2(t), ..., X_n(t),(t \in [0..T]连续变量)
每个随机过程X_i(t)都是一个隐函数F_i(t)和高斯噪声R的和
即 X_i(t) = F_i(t) + R
现在,我在k个时间点t_1, t_2, ..., t_k, 上测得
X_1,X_2,..X_n的采样值(因此有,n*k个实验采样值).
我的目标是根据这些采样值,计算出在所有时刻点,n个隐函数各自为
最大值的概率分布。形式化表述如下:
定义Y(t,i)为在时刻t,F_i为所有F_j, (j=1..n)里面的最大值的概率
即Y(t,i) = prob( Fi(t)=max_{j=1}^{n}(F_j(t)) )
这里允许对隐函数F_i(t)设定一些假设(比如连续)。
请问有没有什么随机过程的理论或者模型研究这种根据已知的采样点,
来反推最大隐函数的概率分布的问题。 |
|
j*****n 发帖数: 1545 | 24 我有n个 gaussian mixture model training data, 假设已知每个model都是2个
gaussian model 的混合。
我用 EM 把这些gauss的mean和var都算出来了。
现在我有一个新的mixture model, 假设也是2个gauss的混合,通过EM我也把这2个
gauss的mean和var算出来了。
我想利用前面那n个 mixture gaussian的 mean和var 来估计一下这个新model的mean,
var的概率。
我一开始想的是把training的gaussian mixture 的2n个mean, 2n个var 分开来,第一
个gauss的mean 和 var组成一个2维的概率分布, 第二个gauss的mean和var组成另一个
2维的概率分布, 然后再分别计算新 model的2个gauss的 P1[mean,var], P2[mean,var
].
感觉这样做不对头。
不知道我说清楚没有... |
|
s*****r 发帖数: 183 | 25 任何一点的收敛的速度和真的概率分布在该点的概率有关。
对于任何一个点,相当于是一个二项分布的观测值和样本量的比值收敛于二项概率的问
题。该率接近一半的地方收敛快,别的地方收敛慢。
discrete
alon
ove
a
estimat
coverg
p |
|
c******s 发帖数: 20 | 26 由条件概率的基本定义,把P(x;y,z)和P(y;z)替换,然后考虑到SUMy:P(x,y,z)将会得
到(x,y,z)的边缘分布,这里也就是y,z的联合分布,最后再次根据条件概率的定义即得
结果。 |
|
|
n******s 发帖数: 1523 | 28 以下的都是先验概率(a priori)。主要是因为后验概率依赖于对出过的牌的解读。不
同的人得出的概率也就千差万别。
1)庄没红A,首出K被对方的Ace 拍死的概率多大?答案是~ 2/3。
以下三种情况K死了 (对家天绝的情况被忽视了):
a)下家一张红A, 概率是 (25/75 * 50/74 )*2 ~= 4/9
b)下家2张 红A,概率是 (25/75 * 24/74) ~= 1/9
c)下家没红A,对家也没红A,概率是 (1 - 4/9 - 1/9)* (25/50 * 24/49) ~= 1
/9
合起来大概,4/9+1/9+1/9 = 2/3。
2)庄没红A,首攻10,这个计算太复杂了。还要涉及到K,Q, J的分布。不过如果假设
那些的概率小到可以忽略不计(肯定是小的,没有算过到底多小)。假设也是被A拍死
的话,概率也就差不多2/3了。
3)庄没红A,首冲KK,悲剧的概率多大? 这个要简单些,就是下家或上家有AA的时候:
1/9*2 ~ = 2/9。 |
|
l******r 发帖数: 682 | 29 逐点收敛point-wise convergence不一定是依分布收敛,这个太容易举反例了,因为收
敛到的函数不一定是分布函数。
相反,依分布收敛不一定是逐点收敛,譬如某个几乎处处收敛但非逐点收敛的可测函数
,它一定是依分布收敛的,因为几乎处处收敛强于依概率收敛强于依分布收敛。
至于一致收敛,如果加上函数的可测性的限制,它应该是几乎处处收敛的?这个我不敢
妄言了,理论的东西学的太久都忘光了。 |
|
C********g 发帖数: 9656 | 30 【 以下文字转载自 THU 讨论区 】
发信人: Communipig (共产猪), 信区: THU
标 题: 清华硕士及其导师被指抄袭 学校称构成学术不端
发信站: BBS 未名空间站 (Sun Jun 12 10:17:33 2011, 美东)
http://news.sohu.com/20110612/n309943569.shtml
来源:新民晚报·新民网
2011年06月12日04:18
潘晓春勾画出的论文核心公式被抄袭的地方 实习生 朱云辰 摄
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主
要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大
学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无
奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,
表示将会做出处理。
日前,快报记者就此事展开了... 阅读全帖 |
|
o***s 发帖数: 42149 | 31 潘晓春勾画出的论文核心公式被抄袭的地方
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,表示将会做出处理。
日前,快报记者就此事展开了调查。清华校方也向本报答复:初步构成学术不端,6月底将会作出最终的调查和处理结果。
无意中发现
论文被抄
最近这几年,潘晓春每年都有一篇学术论文发表,而这完全是兴趣使然。
“可能像我们这样工作多年的人,发表论文也就是评职称的需要,我当初也不排除这种想法,但后来发论文则与别人不同了,我确实很有兴趣研究些自己领域内的学术问题。”
潘晓春是江苏泰州人,1995年毕业于河海大学陆地水文专业,后进入东南大学攻读硕士,此后进入江苏省电力设计... 阅读全帖 |
|
g***r 发帖数: 6820 | 32 怎么跟你说好呢
从最基本的说吧。概率统计是用重复实验得到的样本去推断一个population的性质
这么做只是因为那些性质不用这种工具很难得到。一个物理规律搞清楚的事件根本不是
概率
统计的范畴,比如那颗撞地球的彗星,从物理定律能算出它要撞地球,那个根本不是概
率问题,还说什么大概率事件。但是你说population of comets,就可以用(甚至现在
只能用)统计来说,那个是个小概率事件了。还有就是你要分清事件的概率分布(这个
是纯数学)和观察到的一个事件(observation)完全是两个东西,不要互相取代,也没
有谁从一个observation能牛逼到去推断概率大小。知道这个,就不要谈历史是大小概
率这么可笑的话了。
你关于概率统计的高论里充满了类似的概念性错误。真没法一一说。 |
|
C********g 发帖数: 9656 | 33 http://news.sohu.com/20110612/n309943569.shtml
来源:新民晚报·新民网
2011年06月12日04:18
潘晓春勾画出的论文核心公式被抄袭的地方 实习生 朱云辰 摄
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主
要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大
学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无
奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,
表示将会做出处理。
日前,快报记者就此事展开了调查。清华校方也向本报答复:初步构成学术不端,
6月底将会作出最终的调查和处理结果。
快报记者 张瑜 王凡
无意中发现
论文被抄
最近这几年,潘晓春每年都有一篇学术论文发表,而这完全是兴趣使然。
“可能像我们这样工作多年的人,发表论文也就是评职称的需要... 阅读全帖 |
|
w********c 发帖数: 2632 | 34 ☆─────────────────────────────────────☆
jetchen (飞机) 于 (Wed Oct 24 21:46:52 2007) 提到:
发信人: jetchen (飞机), 信区: Mathematics
标 题: 有没有分布函数的分布 这个概念?
发信站: BBS 未名空间站 (Wed Oct 24 21:46:18 2007)
比如我有n个 gaussian, 均值和方差各不相同, 如果我想考虑一下这些gaussian之间
的分布,有没有办法?
n个gaussian的mean 我觉得可以很简单的认为就是n个gaussian的average,关键是方差
呢?
有没有什么方法可以解决这一类问题?
谢谢
☆─────────────────────────────────────☆
CestTous (这些全是阴谋) 于 (Wed Oct 24 23:38:04 2007) 提到:
如果我没理解错的话,相当于有一个离散的随机变量Z,Z的取值影响目标随机变量X服
从哪一个Gaussian,把X的概率都写成conditioning o |
|
l********n 发帖数: 9 | 35 存在30对随机变量(x1,y1),(x2,y2),......,(x30,y30),x1与y1,x2与y2,......,x30与y30
之间相关,但相关关系不完全相同.(x1,y1)的分布已知,同样其它29对随机变量的分布也已
知,按它们的分布,随机产生25组样本,每组样本中有100个个体,每个个体包含(x1,y1),(x2
,y2),......,(x30,y30)共30对数据.对每个个体,把y1,y2,......,y30相加得YS,但只把x1
,x3,x4,x7,x8,x13,x15,x17,x23,x25,x27,x30(即只把其中若干个相加)相加得XS,这样得
到
新的25组样本,每组样本中包含100对(XS,YS).对新的每组样本,按XS从小到大排序,取出排
在95位的XS及其对应的YS(不管YS的排序),这样得到25对(XS,YS).请问得到的25个YS服从
什
么分布?这里25组是随便定,如果需要可以取多于25组.要知道它的分布,是否还需要其它条
件?这涉及到统计中的什么问题?
望各位大侠赐教. |
|
c*****n 发帖数: 1877 | 36 N个高斯分布的独立变量之和仍然是高斯分布。
N个均匀分布的独立变量之和不再是均匀分布,当N趋于无穷大时,变为高斯分布。
C) |
|
H****h 发帖数: 1037 | 37 对于定义在紧度量空间S上的度量,有一种Prohorov 距离。
两个测度m和n的距离是满足以下条件的正数a集合的下确界:
对于任何两个S的闭子集K和L,如果K和L的距离大于a,
则m(K)+n(L)<1+a。
还有一个等值的定义如下。
如果有一个S*S上的测度l满足第一个分量的分布是m,而
第二个分量的分布是n,则称l是m和n的couple。
两个测度的couple不是唯一的,最简单的就是乘积测度。
在这个问题中,我们倾向于选取集中在对角线附近的分布。
m和n的距离就是满足以下条件的正数a集合的下确界:
存在m和n的一个couple,使得{(x,y):d(x,y)>a}的
测度小于a。换言之,我们可以找到定义在同一个概率空间
到S上的两个影射X和Y,分别服从m和n分布,并且满足
P{d(X,Y)>a}
这个测度的意义在于它所确定的拓扑即为星弱拓扑。
对于非紧空间,这个测度形式上可以同样定义,
但不知道意义如何。 |
|
g*********u 发帖数: 21 | 38 请各位给一个比较简单的证明:
均匀分布在[0,T)上的一随机变量D,和任意一实数a的和为D+a
证明 (D+a)mod T 也是一个均匀分布在[0,T)上的随机变量。
mod为取模运算。
从直觉上好像很明白,但是哪位可否给出一个证明呢?
比如 (D+a)mod T 的分布确实为一个均匀分布
谢谢各位!!! |
|
i*******D 发帖数: 993 | 39 【 以下文字转载自 Statistics 讨论区 】
发信人: invalidID (阿), 信区: Statistics
标 题: 问一个规划,概率类的问题
发信站: BBS 未名空间站 (Sun Jan 25 17:41:41 2015, 美东)
有一个系统里有N个并行的管道输送液体。每个管道的流速在正常情况下都是常数。每
个管道都有一定概率堵塞,从而完全停止输送,并且在人为疏通前不能自动恢复。每个
管道的堵塞与否和堵塞的概率都与其它管道独立。假定人为疏通一次后可以让系统内所
有堵塞管道同时恢复,但是要让全系统停止运行t时长。可以假定每个管道堵塞的概率
随时间是一个泊松分布。求一个最好的疏通策略,即在堵塞的管道数目n超过多少时候
,采取疏通来保证系统长时间平均流量最大。同时求在这种策略下系统长时间的平均流
量。注意,每个管道堵塞与否可以实时监测。
进一步的变化是:当系统疏通时,只能保证每个管道有一定的概率pd被疏通,求同样的
策略和平均流量。
目前的分析:这个问题其实可以看做很简单的概率问题的变化。可以把它按照一个动态
编程或者递归的方式来考虑。但是它涉及到测略,比如,当堵塞的管... 阅读全帖 |
|
y***n 发帖数: 309 | 40 呵呵,我不同意你的观点。
先申明我也是Bayesian(or Empirical Bayesian).
频率学派与贝叶斯学派的区别主要是是否允许先验概率分布的使用。
频率学派并不把所有参数看作普通变量(我想应该是known or unknown fixed
variable,姑且用你的名词),比如hierarchical model和random effect model。
而贝叶斯学派在先验分布中也有普通变量,比如hyperprior parameter。
你对无偏估计的论断我也不同意,因为你的定义本身不合理。如果t是随机变量,
你可以用E[T|t]=t,或者在由边际分布得到E[T]=m,一个独立于t的量。
贝叶斯的好处在于贝叶斯的推断问题相对简单,点估计,区间估计和假设检验
全部可以由后验分布得到,尤其是计算机技术的发展和MCMC方法的出现使得
非共轭后验分布的使用和计算成为可能。而且它的理论架构天然符合人渐进
的认识规律。我今天早上刚好还想到可以用“时时勤拂拭,莫使惹尘埃”来
形容贝叶斯学派,恰不恰当大家看看。
但是贝叶斯(Full Bayesian)的问题在于,无信息先验已经被 |
|
m**c 发帖数: 88 | 41 这个概率是不是这样的呢?
比如 X 是标准的 T 分布 , X~ T(0,1,k), k是自由度。
这个标准T分布的pdf和CDF分别是: f(X)和F(X),这是已知的。
还有一个关于T分布的结论是这样的, 如果有 Y~T(m,V,k), 那么
Z=(Y-m)/sqrt(V)是一个标准的T分布,即Z~T(0,1,k)。
那么我是不是可以这样求Y的pdf和cdf:
Y的pdf:g(Y)=f(Z)=f((Y-m)/sqrt(V))=....
Y的cdf:G(Y)=F(Z)=F((Y-m)/sqrt(V))=....
这样对吗?求出那个表达式是pdf和cdf吧? |
|
j****i 发帖数: 68152 | 42 今天在看一些关于哲学的东西,不小心给我看了几篇说到量子力学的帖子,看完我笑死
了。
量子力学有一个“测不准原理”,说当你观察一个东西的时候,你不能同时确定这个东
西的位置和速度,你确定了这个东西的位置,那么它的速度是不可能被观察到,而如果
你确定了这个东西的速度,那么你就不可能知道它的位置。
这简直荒谬的很啊,按量子力学的说法,当一辆汽车在跑时,如果测出了它的速度,那
么它的位置我们是不知道的,而如果知道了汽车的位置在哪里,那么它的速度我们也是
不可能测出的。这不是神经病医院的病人才有的想法吗?
量子力学还有个所谓“波粒二相性”,说所有的物质都对应有一个所谓的“物质波”,
比如光,它既有粒子性,也有波动性,电子也一样,所有物质都一样。我就很郁闷了,
我也是物质啊,难道我自己也会有一个物质波,具有波动性吗?有的话我怎么不知道啊
?去医院检查的时候也应该能检查的出来吧?
搞笑的,量子力学里还有一个叫“电子概率云”的东西,意思说,电子不是确定的在某
个地方的,而是有一定的概率分布在整个空间的,比如电子出现在A点有50%概率,出现
在B点20%的概率,出现在C点有10%的概率...就像掷骰子一... 阅读全帖 |
|
K*V 发帖数: 192 | 43 好无聊的题,我来推一下。
假设老中不冲厕所概率p1,白人不冲厕所概率p2 , 两者差别 d = p1-p2.求d>0的概率。
基于之前的条件 p1*(1-w)+p2*w=x
得到:p1*(1-w)+(p1-d)*w=x
then:d=(p1-x)/w
需要求P(d>0)=P(p1-x>0)=P(p1〉x).
就是老中不冲厕所概率大于x的概率。因为老中之间都一样,假设p1服从uniform分布,
P(p1〉x)=1-P(p1 |
|
d*z 发帖数: 150 | 44
作有八个状态的马氏过程,八个状态分别记为A(-2),A(-1),A(0),A(1
),B(-1),B(0),B(1),B(2),其中,A(0)为开始状态,A(-2),B(2)为结
束状态。状态A(k)表示当前状态为A领先B
k分,而且轮到A射击,B(k)表示当前A领先B k分,但轮到B射击。
做出状态转移图以后,可以看到一个很有趣的现象(主要是a+b=1引
起的),8个状态串成一条线,而每个状态向前转移的概率为a,向后
转移的概率为b;初始状态为第五个状态。
所以我们可以把问题简化为另一个更简单的问题。一个(0,1)序列,
其各个元素独立同分布产生,每个元素为1的概率为a,为0的概率为b.
当序列中1的数目比0多三个,或则0的数目比1
多四个时,序列结束。问最终序列中1比0多的概率。 |
|
i*******D 发帖数: 993 | 45 有一个系统里有N个并行的管道输送液体。每个管道的流速在正常情况下都是常数。每
个管道都有一定概率堵塞,从而完全停止输送,并且在人为疏通前不能自动恢复。每个
管道的堵塞与否和堵塞的概率都与其它管道独立。假定人为疏通一次后可以让系统内所
有堵塞管道同时恢复,但是要让全系统停止运行t时长。可以假定每个管道堵塞的概率
随时间是一个泊松分布。求一个最好的疏通策略,即在堵塞的管道数目n超过多少时候
,采取疏通来保证系统长时间平均流量最大。同时求在这种策略下系统长时间的平均流
量。注意,每个管道堵塞与否可以实时监测。
进一步的变化是:当系统疏通时,只能保证每个管道有一定的概率pd被疏通,求同样的
策略和平均流量。
目前的分析:这个问题其实可以看做很简单的概率问题的变化。可以把它按照一个动态
编程或者递归的方式来考虑。但是它涉及到测略,比如,当堵塞的管道数量大于n时,
以后平均流量的预期。而这个预期又依赖于以后所采取的策略。并且都是一个含时间的
函数。我目前只能找到一个策略是跟不能监测任何管道堵塞的情况比,由于能监测,那
么一定可以提高平均流量。但是是否最优,不能证明, 并且也不能求出这样策略下的
平... 阅读全帖 |
|
c***s 发帖数: 70028 | 46 一名高三学生,在不同省份,考上名校的几率差别有多大?答案是:最大差别288倍。
高校招生分配名额失衡的背后,是地方政府、教育部和高校之间利益交换的“名利场”,而被高考决定着命运的考生,却没有任何发言权。
根据北京大学法学院教授张千帆在其研究课题“大学招生与宪法平等”中得出的结论,广东、安徽考生考进北大的概率只有北京孩子的1%。换个角度理解,北大对广东、安徽学生设置的门槛比北京考生整整高了100倍。而上海考生进复旦的机会是全国平均的53倍,山东考生的274倍,内蒙古考生的288倍。
5月23日,包括张千帆在内,来自北大、清华、社科院等单位的15位学者上书国务院、教育部,请求取消高考户籍限制,“切实推进教育与社会公平改革”。
与户籍捆绑在一起的中国高校招生名额分配制,经过多年演变,形成了固化的利益格局,并成为高等教育公平改革路上,最难啃的硬骨头。作为计划经济时期的特殊产物,配额制已在中国大多数领域被打破,但在高校招生中,囿于各种利益纠葛,配额制所带来的不均衡现象,却有着顽强的生命力,甚至沦为各种利益交换的名利场。
两年前发布的《国家中长期教育改革和发展规划纲要》,明确要求“加强信息公开和社... 阅读全帖 |
|
m*****n 发帖数: 3575 | 47 转移概率应该可以用超几何分布来计算
给定母本的黑球数,得出单个子本的黑球数的概率分布 |
|
s*******y 发帖数: 45 | 48 来自主题: JobHunting版 - 一道概率题 桌上有100个正常的硬币,初始状态下,50个正面朝上(head),50反面朝上(tail)。
拿起一个,如果是正面(head), 就flip成反面,再放回。如果是反面(tail), 就以50%
的概率扔一次。
问,(1) 扔无穷多次后,最终正面和背面的分布如何?
(2) 如果初始情况是所有100个硬币都是正面朝上,最终如何分布?
如何分析?求解 |
|
k****f 发帖数: 3794 | 49 1-3的大
Xi=1是第i个球进入第一个桶的事件, Xi=0是进入第二桶
P(Xi=1)=1/2
\sum Xi是个binormial distribution
P(\sum Xi=1 OR \sum Xi=3)是1-3分步的样子。
=2*C(4,1)*(1/2)^4=1/2
P(\sum Xi=2)是2-2分布
=C(4,2)*(1/2)^4
=6/16=3/8
结论是1-3的大。(其实还有0-4这种情况的,概率是1/8)
如果只有两个球
P(\sum Xi=0 or \sum Xi=2)=2*(1/2)^2=1/2
两种分布可能性一样的。
大?
是2 |
|
b*****g 发帖数: 919 | 50 16个分布等概率 你否定了两个分布 对其他没影响啊 |
|