由买买提看人间百态

topics

全部话题 - 话题: 数据
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
p*****r
发帖数: 1883
1
贡献一个我之前写的贴,刷Kaggle的题是快速成为data scientist的捷径之一,这和什
么山寨leetcode不一样,那个刷200题对实际工作毫无帮助(对面试也几乎无帮助),
刷Kaggle只要刷一俩题,差不多花三个月的业余时间,智力正常的理工科大学毕业生都
能对data science这个东西有个初步但是全面的了解,在数据清理,数据操作,建立模
型,评价模型和结果这些方面都有实际深入的了解,不会再出现“面试官问overfit了
怎么办,我说了Cross Validation,面试官看起来不高兴”然后下面回帖帮楼主的都是
不知所云楼主看了也是云里雾里这样的惨剧。你要是学好了就会发现,其实那个面试官
自己也不太懂就知道个概念才会问那个的问题,照着这个教程来,分分钟和面试官对L1
和L2 regularization 对稀疏feature的表现谈笑风生,如果搞的深入点把深度学习顺
道也会了,说个“其实dropout也是regularization什么什么的”,保证面试官立刻给
你跪舔,再也不敢上来卖弄概念自寻羞辱。
看我辛苦写这么多教学的份上,请允许我宣传一下我们的白宫投票
ht... 阅读全帖
p******d
发帖数: 506
2
Updated on 09/03/2015:
1. 根据大家的反馈,增加了政治庇护的数据,见下面第三图,这个数据并不是绝对准
确,因为移民局没有发布10月到12月的数据,我只能根据前9个月的平均来估计12个月
的总数;另外,移民局的数据只给了每个国家的申请数,并没有给单独国家的approve
数字,不过给了总体的approval rate, 接近90%,也就是说绝大部分申请最终都获批;
2. 增加了L1 visa数据的对比,这个更能反应H1B 数据的反差;
3. 增加了F1 visa, J1 visa数据对比;
3. EB1具体的1a, 1b, 1c数据,移民局并没有发布,所以没办法作图。但是根据F1, J1
vs. H1, L1的数据对比也能猜的八九不离十。中国F1, J1明显超过印度,H1, L1则完
全反转。意味着中国的EB1以1a, 1b为主,印度的EB1以1c为主。
————————————————————
【 以下文字转载自 EB23 讨论区 】
发信人: pureland (君子慎独), 信区: EB23
标 题: 继续上干货,2014中印数据对比
发信站: BBS 未... 阅读全帖
x********n
发帖数: 398
3
来自主题: Basketball版 - 比较30岁时的科比和詹姆斯的数据
科比的生日在8月,此处取其08-09赛季数据(实际上07-08赛季科比的个人数据更好看)
08-09赛季科比的个人数据如下:打满82场,场均26.8分,5.2篮板(其中前场板1.1),4.9助攻,1.5抢断,0.5盖帽,仅2.6失误,2.3犯规。场均出手21.4次,命中率46.7%。场均罚球6.8次。
詹姆斯的数据取14-15赛季截止今日的数据(预测下赛季詹姆斯数据更差)
数据如下:目前出场29场,场均25.2分,4.6篮板(其中前场板0.7),7.6助攻,1.3抢断,0.8盖帽,3.8失误,1.7犯规。场均出手18.1次,命中率48.8%。场均罚球7.9次。罚球不计入出手次数,但是也需要球权的。
科比30岁时的数据保持在生涯平均水平之上或持平,詹姆斯到目前的数据除了助攻略高0.7,盖帽持平,犯规略降0.2,其他各项全面落后。在赛季初,我从预测本赛季詹姆斯数据还可维持在平均水平,下一个赛季将全面下滑,目前看来这个下滑将来的更早一些。
至于30岁这年的带队成绩,目前基本已成定局,科比完胜。科比最可怕的是什么?在每一个小阶段,都有球星与其抗衡甚至超越,但是周期放大,我们发现科比才是最坚挺的... 阅读全帖

发帖数: 1
4
在姚明做内线的时候,20+10的数据很少,所以那时候这个数据成为内线超级球星的标
准,那时候记得好像只有胖子还有呆子还有狼王是这样的数据,后来有个兰多夫也有这
样的数据,但是因为兰多夫防守很差,所以被称为数据刷子。
现在看表妹和浓眉,这数据比起姚明那时候的内线的数据要好很多,20+10都远远不止
了,我没查具体数据,上个赛季写过帖子,好像表妹有一个月的数据是差不多30+12,
这比起巅峰的胖子都差不多,可是成绩很差。
所以比起胖子差远了,比起姚明都不如。
浓眉也是类似的,数据很好,一直20+10,但是黄蜂只进了一次季后赛,后面的都是打
酱油。
而浓眉之前还在接受采访的时候说过,说自己的目标是成为历史前五。
这历史前五,很少有球队这么多年常规赛都这么差的,当时;狼王被黑的这么惨,那也
是年年一轮游,一轮游的前提是进了季后赛呀。
我分析这里面的原因,这些数据有明显水分,第一是好的内线不多了,除了几个明星内
线,剩下的是蓝领,所以他们的数据显得很好,那是因为没有很好的对手。
而胖子和呆子的时代,其实是优质内线很多,互相抵消了,这些内线的能力整体比现在
要好。
而且打法也是原因之一,现在的比赛... 阅读全帖
s*****h
发帖数: 44903
5
来自主题: Football版 - [合集] 数据显示luck也就so so啊
☆─────────────────────────────────────☆
derek040217 (植物人) 于 (Thu Oct 3 14:15:22 2013, 美东) 提到:
带队成绩也就那么回事 算最近几年出来的不错的qb
各项数据和 Rg3 rw3 比 甚至都有些不如
目前看也就是非脑残版 三茄子
怎么就变成best of the best 了
最后能达到马软这样就不错了
☆─────────────────────────────────────☆
wxx07 (干嘛注册) 于 (Thu Oct 3 14:18:11 2013, 美东) 提到:
都是捧杀害人呐。
☆─────────────────────────────────────☆
pangpangzeng (胖胖) 于 (Thu Oct 3 14:23:53 2013, 美东) 提到:
Luck的intangible非常强。一共打了21场比赛,8次comeback win。技术可以练,
intangible是练不出来的。
将来的高度能不能达到菜鼻龙猪,还有待时间检验... 阅读全帖
C********g
发帖数: 9656
6
【 以下文字转载自 Military 讨论区 】
发信人: brihand (brihand), 信区: Military
标 题: 北京环保局:空气质量不能看美国使馆所监测数据
发信站: BBS 未名空间站 (Mon Oct 31 16:29:03 2011, 美东)
北京环保局:空气质量不能看美国使馆所监测数据
http://www.sina.com.cn 2011年11月01日01:32 北京晨报
雾是否就是“污染”?北京是否会成为雾都?市环保局官方监测的空气质量数据为
何与美国大使馆的监测数据有出入?昨天,市环保局副局长、新闻发言人杜少中在微访
谈直面网友质疑,并坦承北京的空气质量“自己与自己比有进步,但需继续努力,减少
污染物排放”。
大雾天并非就是污染天
连续几天的大雾天气让市民非常揪心,空气质量明显下降。昨天,市环保局监测数
据显示,全市轻微污染,仅有平谷区平谷镇空气质量为良。
网友提问说:“连续大雾导致空气质量很差,大雾天是不是就意味着污染比较严重
?”杜少中解释说,雾本来不是污染,只是积累了污染物才会影响空气质量。从一个具
体时间节点看,环境质量还没有摆脱靠天吃... 阅读全帖
c*********r
发帖数: 19468
7
来自主题: _Auto_Fans版 - 从14 MDX的碰撞数据看
Honda还是认真造车的车厂。
拿最重要最基本的正面40%偏置测试数据看,一代MDX时Honda不知道是不是还缺乏经验
,IIHS数据(2001年)可说是惨不忍睹。拿footwell侵入情况来说,从最左侧的
footrest开始算,四个测量点内陷分别是9/20/22/15cm,而同期的一代X5相应数据是6/
7/5/1cm。早了两年的一代M-Class也有12/11/6/6cm,总体情况还是比MDX好很多。拿
footwell数据来比较是因为这里是最靠近前溃缩区主纵梁和安全笼相接的位置。可以说
,Honda的起点是比较低的。到了后来,二代RX在2004年测到了5/5/6/5cm的数据(没有
找到一代RX的数据),这就基本上达到了当时可以称的上标杆的X5的水平,可以说,
Toyota的起点是比较高的。
到了2006年,二代M-Class创造了1/1/2/2cm的神数据,相比一代是一次大的飞跃,但二
代X5则开始吃老本(2007年数据:2/5/6/4cm)。同期二代MDX在2007年数据达到7/8/11
/11cm的水平,相比同期的M-Class、X5、RX都还有很大的差距,但是和自己比,... 阅读全帖
c***s
发帖数: 70028
8
上海
2011年2月18日,上海正式发布限购令,规定本市户籍只能购买两套,非户籍常住人口只能购买一套,第2套住房首付比例不得低于6成。自此进入限购时代。同时要注意的是,上海在年后开征了房产税,对新购第二套以上住房开征房产税,税率一般为每年0.6%。这意味着今年以来上海除了首次置业者之外,其它所有的改善型、投资型和投机型,只要购房,就必须缴纳房产税。上海自此成为中国房地产综合调控最严厉的城市,没有任何城市可以与之相比。我们已经知道,上海的房价泡沫是长三角一带绝望的民间资本堆积而来。在现在这种空前严厉的调控政策之下,上海的房地产市场表现如何呢?它会应声而降吗?
从2010年说起。上海2010年全年一手商品房总共成交972万平米,月平均成交约81万平米,成交均价2.17万元/平米。单说2010年12月份,在限购政策预期之下,成交暴涨,达到140万平米,成交均价达到2.50万元/平米。到今年1月份,成交量仍然维持在105万平米的高位,保持着极其旺盛的成交,成交均价则为2.38万元。这是非常火爆的市场数据,在限购令即将出台之时,市场并未出现任何观望情绪,而是抓紧时间抢购,这是一个耐人寻味的市场信... 阅读全帖
c***s
发帖数: 70028
9
雾是否就是“污染”?北京是否会成为雾都?市环保局官方监测的空气质量数据为何与美国大使馆的监测数据有出入?昨天,市环保局副局长、新闻发言人杜少中在微访谈直面网友质疑,并坦承北京的空气质量“自己与自己比有进步,但需继续努力,减少污染物排放”。
大雾天并非就是污染天
连续几天的大雾天气让市民非常揪心,空气质量明显下降。昨天,市环保局监测数据显示,全市轻微污染,仅有平谷区平谷镇空气质量为良。
网友提问说:“连续大雾导致空气质量很差,大雾天是不是就意味着污染比较严重?”杜少中解释说,雾本来不是污染,只是积累了污染物才会影响空气质量。从一个具体时间节点看,环境质量还没有摆脱靠天吃饭的被动。比如每遇季节交替,静风、逆温、低气压等不利气象条件,导致污染物易积累不易扩散,形成污染天是完全可能的。
数据不能看别人“眼色”
微博上有多位名人转发了美国大使馆监测的空气质量数据,该数据明显高于北京市环保局官方公布的数据。以昨日为例,美国大使馆监测到的北京空气质量指数为307,PM2.5细颗粒物浓度为257,而环保局官方公布的空气污染指数为132。
对此,杜少中明确表示,大使馆(美国驻华大使馆)数据一再申明是内部... 阅读全帖
s*****n
发帖数: 1794
10
《墓碑》的作者杨继绳是怎样篡改、伪造数据的(1)
作者:齐劲松
§1 引言
最近三十年以来,在国内外广泛流传着我国在“三年困难时期”(1959年—
1961年)有数千万人非正常死亡的荒谬观点,“饿死三千万”是其中最有代表性
的说法。
1983年我国国家统计局公布了1949年—1982年期间我国的人口数据(见
[1])。这一人口数据显示,我国在三年困难时期出现了人口大幅度异常减少的
情况,其中最突出的是,1960年我国人口比1959年净减少1000万人。
这些数据公布以后,在国内外引起了重大反响。一些学者对此进行了研究,
杨继绳的研究是其中最有代表性的一个。2008年他出版了《墓碑(一九五八——
一九六二年中国大饥荒纪实》一书(以下简称《墓碑》),在书中他“确认从
1958—1962年期间,中国饿死3600万人。”(见[2])
这部书的出版产生了重大的影响,并且在很短的时间内连续多次再版。这部
书的出版使得“饿死3600万”这一荒谬说法得到更广泛的流传,杨继绳也因此成
为“数千万人非正常死亡”这一荒谬说法的最重要的代表性人物。
我国在三年困难时期究竟是不是有数千万人非正常死亡,这已经成... 阅读全帖
j***h
发帖数: 4412
11
【 以下文字转载自 CivilEngineering 讨论区 】
发信人: jeffh (Jeffh), 信区: CivilEngineering
标 题: 深度解读美国1月就业数据
发信站: BBS 未名空间站 (Mon Feb 7 15:48:59 2011, 美东)
深度解读美国1月就业数据 2011年2月7日 17:24 世华财讯
[世华财讯]美国1月就业数据一方面是就业增加不尽如人意,另一方面却是失业率快速
下降,但是了解美国就业统计方式之后,你的迷惑就能解开并看到一丝曙光。
综合媒体2月7日报道,冬季老伯(Old Man Winter)绝对使要搞明白美国经济正走向何
方变得更加困难。
全美范围一系列暴风雨在1月用经济数据来体现着浩劫,最终1月就业报告一方面是招聘
增加数让人失望,另一方面是失业率快速下降。
Pierpont Securities首席经济师史丹利(Stephen Stanley)说:“1月的经济严重失
真。”
2月的第一周也没有出现好的开始,中东部地区遭遇大雪,南部陷入严寒。未来一周的
数据分量很轻:小企业调查、每周失业金申请以及消费者信心。
因此... 阅读全帖
b*****d
发帖数: 61690
12
环球时报驻日本特约记者王婧报道,据日本新华侨报网9月27日消息,在日本“3&#
8226;11大地震”中,宫城、岩手两县4个市町发生了户籍信息丢失现象。鉴于此事对日
后工作产生的严重影响,日本法务省9月27日决定,从2012年开始,针对偏远地区法务
局开展户籍管理系统远程管理改造,备份偏远地区法务局保存的户籍数据。
按照法务省的计划,如果备份工作顺利,未来发生重大灾难时,各地方机构保留的
户籍数据将不会再发生丢失现象。法务省将在2012年的预算案中为数据备份及法务省信
息网络工作强化两个项目划拨29亿日元预算。
据了解,目前,包含与居民出生及死亡等能够证明个人身份的户籍信息相关各项业
务都是在居民所在地方政府的相关机构接待窗口办理,相关数据也是由各个地方政府独
自管理。法务省及下属各县法务局与所属各市町村之间并没有联网。以往的居民个人信
息整理收集统计工作均由各市町村将收录有所有户籍数据信息副本的磁盘上交各都道府
县法务局备案,每年提交一次。
里氏9级的大地震以及因地震引发的海啸损坏了很多市区町村的政府办公设施,导
致宫城县南三陆町、女川町以及岩手县陆前高田市、大槌町发生了大量户籍数据... 阅读全帖
b*****d
发帖数: 61690
13
北京环保局:空气质量不能看美国使馆所监测数据
http://www.sina.com.cn 2011年11月01日01:32 北京晨报
雾是否就是“污染”?北京是否会成为雾都?市环保局官方监测的空气质量数据为
何与美国大使馆的监测数据有出入?昨天,市环保局副局长、新闻发言人杜少中在微访
谈直面网友质疑,并坦承北京的空气质量“自己与自己比有进步,但需继续努力,减少
污染物排放”。
大雾天并非就是污染天
连续几天的大雾天气让市民非常揪心,空气质量明显下降。昨天,市环保局监测数
据显示,全市轻微污染,仅有平谷区平谷镇空气质量为良。
网友提问说:“连续大雾导致空气质量很差,大雾天是不是就意味着污染比较严重
?”杜少中解释说,雾本来不是污染,只是积累了污染物才会影响空气质量。从一个具
体时间节点看,环境质量还没有摆脱靠天吃饭的被动。比如每遇季节交替,静风、逆温
、低气压等不利气象条件,导致污染物易积累不易扩散,形成污染天是完全可能的。
数据不能看别人“眼色”
微博上有多位名人转发了美国大使馆监测的空气质量数据,该数据明显高于北京市
环保局官方公布的数据。以昨日为例,美国大使馆监测到的北京空气... 阅读全帖
b*****d
发帖数: 61690
14
CPI数据被泄密案侦破过程披露:用上海方言抓捕
2013年02月23日02:34 京华时报 我有话说
本报讯(记者周鑫 通讯员傅晓雨)昨天上午,承办CPI数据被泄密案的西城检察院首
次披露了案件的侦破过程。
2008年至2011年,路透社累计7次精准“猜”对了我国的月度CPI数据。经相关部门
调查,这是内部人员涉嫌泄密所致,“内鬼”中有国家统计局办公室秘书室原副主任孙
振、中国人民银行原干部伍超明等多人。
目前,已有8人因涉案获得法院判决。其中,孙振、伍超明等被判处5年至6年不等
的刑期。
■找线索
统计局官员涉案被调查
2011年2月28日,西城检察院反渎职侵权局按照国家保密局、最高人民检察院、北
京市人民检察院的指示,成立CPI数据被泄密案专案组。国家统计局办公室秘书室原副
主任孙振,以及在上海某证券公司工作的郑飞首先进入专案组的视线。
孙振是国家机关工作人员,行踪相对固定,比较容易控制。而对于郑飞的情况,专
案组仅知道其在上海某证券公司工作,有和海外媒体接触的经历,关于他的联系方式也
只有一个固定电话。但郑飞是整个泄密事件的关键环节,孙振从国家统计局掌握的宏观
经济数据是通过郑... 阅读全帖
y**********g
发帖数: 2285
15
国家统计局这个周末公布的宏观经济数据引发市场严重悲观。数据显示,我国8月规模
以上工业增加值同比增长6.9%,远低于路透调查预估中值8.8%,且创下68个月新低。中
国工业增加值增速上次跌破7%还要追溯到2008年12月,当时金融危机让这项数值连续两
月不足6%,中国随即出台了4万亿投资计划。
除工业增速外,统计局本次公布的投资、消费数据亦低于预期,都暗示着经济下行压力
沉重,甚至有分析称三季度GDP增速可能降至接近7%的水平。不过统计局专家指出,8月
数据出现一时回落,要考虑到基数、气候等特殊因素的影响,总体经济运行仍在合理区
间。
2014年8月份规模以上工业增加值增长6.9%创新低
宏观经济数据全面低迷
中国国家统计局周六公布,我国8月规模以上工业增加值同比增长6.9%,比7月份回落2.
1个百分点。这远低于路透调查预估中值8.8%,且为近六年来最低水平,是本世纪我国
月度工业增加值增速第5次跌破7%,前期低点是金融危机中的2008年11月和12月,分别
为5.4%和5.7%。
分三大门类看,8月份,采矿业增加值同比增长4.2%,制造业增长8%,电力、热力、燃
气及水生产和供应业... 阅读全帖
t*******a
发帖数: 4055
16
占豪:西方黑中国无极限,看到这个数据真的觉得太不要脸了
2017-10-28 08:40栏目:汉唐归来
浏览数:4171次
10月25日,华尔街见闻援引德国数据网站Statista今年早些时候的一份报告结果称,中
国在各国消费者印象中性价比高,但在品牌声誉方面甚至低于孟加拉国。意思是,这个
在不考虑价格的情况下,世界各国消费者看到一件商品MADE IN 商标后面跟着一些国家
或地区时,愿意购买中国制造的消费者比愿意购买孟加拉制造的消费者都少。
在报告中,网站还列出了世界各国消费者印象中的关键词,关于中国的部分是性价比高
。中国商品性价比高的评价个人认为没什么问题,但性价比的前提是得有“性”,“性
”就是性能,性能高、价格低就是中国商品的特质,即同等品质的商品中国商品价格普
遍较低。
然而,在世界最受尊重的“MADE IN”生产标签上,排在中国前面的不止欧美日本这些
国家,连巴西、土耳其、印度、墨西哥、印尼、越南、孟加拉都排在中国前面。甚至,
连巴西制造的国家品牌认可度都有42,中国却只有28。
看到这样的排名,作为一个正常人,感觉就一句话:
真能歪扯!为了黑中国,真的是太不要脸了!
图... 阅读全帖

发帖数: 1
17
来自主题: Military版 - 点评5月经济数据
姜超:点评5月经济数据——内需显著下滑,全靠地产托底
摘 要
6月14日,统计局公布了5月经济数据:5月工业增加值增速6.8%,1-5月固定资产投
资增速6.1%,5月社会消费品零售增速8.5%。我们的观点是:内需显著下滑,全靠地产
托底!
一、工业生产稳中略降
5月规模以上工业增加值同比增速6.8%,较4月微幅回落。今年以来,工业增加值同
比增速基本稳定在7%左右,主要原因有三个:一是地产投资持续高增长,拉动工业需求
。二是“规模以上”口径调整,导致样本数据表现好于整体。三是春节错位导致开工偏
晚,以及环保限产暂告段落,令生产集中释放,而这也使得发电耗煤等中观高频数据表
现好于工业整体。
工业生产稳中略降,在中微观层面也有所印证。一是17个主要工业行业增速涨跌各
半,其中中游加工组装类行业增速普遍下滑,是主要拖累。二是主要工业品产量增速涨
跌互现,发电量以及钢铁、有色产量增速上升,但煤炭、水泥、乙烯、汽车产量增速下
滑。
新经济保持较快增长,高技术产业、装备制造业等新产业增加值继续高增长,新能
源汽车、集成电路、工业机器人等新产品产量增速也同样维持高位。
二、投资全靠地产托底
1-5... 阅读全帖
t*******a
发帖数: 4055
18
徐令予:陷歧视控诉哈佛交出招生数据,他们怎么评分的
徐令予
徐令予
加州大学洛杉矶分校物理系研究员
分享到:
3
14
2018-07-30 09:20:49 字号:A- A A+ 来源:观察者网
关键字: 哈佛招生哈佛歧视亚裔哈佛招生数据
【文/ 观察者网专栏作者 徐令予】
“公平入学学生会”SFFA(Students for Fair Admissions) 是美国的一个私人团体,
他们控告哈佛大学在本科新生录取过程中歧视亚裔美国学生已经有三年之久了。今年6
月初,SFFA向美国波士顿地方法院呈交了一份补充文件。该文件把哈佛多年来深藏不露
的海量入学数据公之于众,一石激起千层浪,事情有些失控了。哈佛这次真的摊上事儿
了。
在原告方SFFA多年逼迫下,哈佛大学被迫交出了自2009年起连续六年招生周期中超过16
万名申请人的档案。哈佛招生办对每个申请学生按照“学业”、“课外活动”、“竞技
运动”、“个性”和“综合”这五类进行评级,每类分六等。对哈佛招生数据进行详细
分析后,起诉方的专家组成员杜克大学的经济学教授Peter Arcidiacono撰写了一分长
达1... 阅读全帖
c****x
发帖数: 6601
19
徐令予:陷歧视控诉哈佛交出招生数据,他们怎么评分的
http://www.guancha.cn/XuLingyu/2018_07_30_466120_s.shtml
加州大学洛杉矶分校物理系研究员
2018-07-30 09:20:49字号:A- A A+来源:观察者网
关键字: 哈佛招生哈佛歧视亚裔哈佛招生数据
【文/ 观察者网专栏作者 徐令予】
“公平入学学生会”SFFA(Students for Fair Admissions) 是美国的一个私人团体,
他们控告哈佛大学在本科新生录取过程中歧视亚裔美国学生已经有三年之久了。今年6
月初,SFFA向美国波士顿地方法院呈交了一份补充文件。该文件把哈佛多年来深藏不露
的海量入学数据公之于众,一石激起千层浪,事情有些失控了。哈佛这次真的摊上事儿
了。
在原告方SFFA多年逼迫下,哈佛大学被迫交出了自2009年起连续六年招生周期中超过16
万名申请人的档案。哈佛招生办对每个申请学生按照“学业”、“课外活动”、“竞技
运动”、“个性”和“综合”这五类进行评级,每类分六等。对哈佛招生数据进行详细
分析后,起诉方的专家组成员杜克大学的经济学教授P... 阅读全帖
F*V
发帖数: 3978
20
北京环保局:空气质量不能看美国使馆所监测数据
http://www.sina.com.cn
雾是否就是“污染”?北京是否会成为雾都?市环保局官方监测的空气质量数据为
何与美国大使馆的监测数据有出入?昨天,市环保局副局长、新闻发言人杜少中在微访
谈直面网友质疑,并坦承北京的空气质量“自己与自己比有进步,但需继续努力,减少
污染物排放”。
大雾天并非就是污染天
连续几天的大雾天气让市民非常揪心,空气质量明显下降。昨天,市环保局监测数
据显示,全市轻微污染,仅有平谷区平谷镇空气质量为良。
网友提问说:“连续大雾导致空气质量很差,大雾天是不是就意味着污染比较严重
?”杜少中解释说,雾本来不是污染,只是积累了污染物才会影响空气质量。从一个具
体时间节点看,环境质量还没有摆脱靠天吃饭的被动。比如每遇季节交替,静风、逆温
、低气压等不利气象条件,导致污染物易积累不易扩散,形成污染天是完全可能的。
数据不能看别人“眼色”
微博上有多位名人转发了美国大使馆监测的空气质量数据,该数据明显高于北京市
环保局官方公布的数据。以昨日为例,美国大使馆监测到的北京空气质量指数为307,
PM2.5细颗粒物浓度为25... 阅读全帖
F*V
发帖数: 3978
21
北京环保局:空气质量不能看美国使馆所监测数据
http://www.sina.com.cn
雾是否就是“污染”?北京是否会成为雾都?市环保局官方监测的空气质量数据为
何与美国大使馆的监测数据有出入?昨天,市环保局副局长、新闻发言人杜少中在微访
谈直面网友质疑,并坦承北京的空气质量“自己与自己比有进步,但需继续努力,减少
污染物排放”。
大雾天并非就是污染天
连续几天的大雾天气让市民非常揪心,空气质量明显下降。昨天,市环保局监测数
据显示,全市轻微污染,仅有平谷区平谷镇空气质量为良。
网友提问说:“连续大雾导致空气质量很差,大雾天是不是就意味着污染比较严重
?”杜少中解释说,雾本来不是污染,只是积累了污染物才会影响空气质量。从一个具
体时间节点看,环境质量还没有摆脱靠天吃饭的被动。比如每遇季节交替,静风、逆温
、低气压等不利气象条件,导致污染物易积累不易扩散,形成污染天是完全可能的。
数据不能看别人“眼色”
微博上有多位名人转发了美国大使馆监测的空气质量数据,该数据明显高于北京市
环保局官方公布的数据。以昨日为例,美国大使馆监测到的北京空气质量指数为307,
PM2.5细颗粒物浓度为25... 阅读全帖
k*********l
发帖数: 1218
22
来自主题: USANews版 - 只有大数据才有用,poll是noise
上个星期的文章,什么是大数据,就是大量的,没有经过人工处理,随机的数据,
trump是否能赢你要看下面的几个数据:
1)各大social network网络的follower数据
2)一些重要新闻的comments,和like,dislike的数据
3) search 的关键词的出现频率,这个我们拿不到,只有google有
4)各地rally参加的人数,老妖婆参加的人数多少,trump有多少
poll在信息发达的今天,已经没有多大用处了,只有大数据才能给给正确的方向。
还有就是不要被媒体brain wash,多用logic thinking,这次对gay的袭击
1)FL是最重要的swing state,想想看普通人会怎么投票
2)LGBT全面导向谁?
3)妇女导向谁
4)黑人会导向谁
Poll和各大媒体都是noise,有时候可以当作反指,越是抹黑谁,说明谁越有可能赢(
但是不是所有时候,因为媒体最重要的就是引起争议,所以更多的时候是充当了挑起战
火的脚色,所以就是noise)
----------------
发信人: katharinezl (linlin), 信区: USANews... 阅读全帖
D*V
发帖数: 3096
23
发信人: brihand (brihand), 信区: Military
标 题: CPI数据泄密涉及5人已被立案侦查
发信站: BBS 未名空间站 (Mon Jun 20 12:30:10 2011, 美东)
CPI数据泄密涉及5人已被立案侦查
http://www.sina.com.cn" target="_blank" class="a2">http://www.sina.com.cn 2011年06月20日16:51 中国新闻网
中新网北京6月20日电(记者 尹力)记者20日从北京市人民检察院获悉,国家宏观数
据泄密事件已进入立案侦查阶段。北京市人民检察院反渎职侵权局局长张华伟表示,目
前已对涉及国家宏观经济数据泄密事件的5人进行立案侦查,案件还在进一步侦查之中。
据媒体报道,6月8日,路透社再次抢先发布我国经济数据,预测中国5月份CPI较上
年同期上涨5.4%,将追平3月份创下的32个月高位,与此同时,网络上各位“经济学家
”和各家投资机构乃至网民对于最新宏观经济数据的预测也热火朝天。
与此类似,彭博也在其终端上发布称,经济学家对宏观数据的预测值显示... 阅读全帖
F********P
发帖数: 805
24
感谢各位朋友线上的和线下的热心回答。
成果如何保护是个普遍的问题。
其实不管是老板和博士后,站在各自的角度上都是对的。如果文章能够更快的出来,这
个问题就变简单了。在合同快要结束的时候,博士后不得不慎重考虑数据的安全性问题。
一位朋友提出了一个好的建议说,给老板数据通过E-mail发送。这样至少给自己留有证
据。
我们组的数据是上传到网络硬盘的,老板通过纸面要求,规定组员上传所有数据。
采取RAFTPSU的建议,今天我把原始数据提交上去了,很多很多,其实除了自己别的人
真的很难整理出来有头绪的处理数据。没想到老板又亲自找来说处理过的数据也要交,
学校的NDA规定数据不能泄露出去,使用时不能不带他的名字。并口头许诺说使用我的
数据一定会和我打招呼。
从他对待前面一位博士后的数据来看,我并不如此期望。但是又觉得找不到借口不上传
已经处理好的数据。但我也口头告诉他,plagrism 到处都有,希望他能够得到提醒。
现在自己争取写文章初稿,数据到合同结束的时候再交,希望更多地保护好自己的成果
j***h
发帖数: 4412
25
来自主题: JobHunting版 - 深度解读美国1月就业数据 (转载)
【 以下文字转载自 CivilEngineering 讨论区 】
发信人: jeffh (Jeffh), 信区: CivilEngineering
标 题: 深度解读美国1月就业数据
发信站: BBS 未名空间站 (Mon Feb 7 15:48:59 2011, 美东)
深度解读美国1月就业数据 2011年2月7日 17:24 世华财讯
[世华财讯]美国1月就业数据一方面是就业增加不尽如人意,另一方面却是失业率快速
下降,但是了解美国就业统计方式之后,你的迷惑就能解开并看到一丝曙光。
综合媒体2月7日报道,冬季老伯(Old Man Winter)绝对使要搞明白美国经济正走向何
方变得更加困难。
全美范围一系列暴风雨在1月用经济数据来体现着浩劫,最终1月就业报告一方面是招聘
增加数让人失望,另一方面是失业率快速下降。
Pierpont Securities首席经济师史丹利(Stephen Stanley)说:“1月的经济严重失
真。”
2月的第一周也没有出现好的开始,中东部地区遭遇大雪,南部陷入严寒。未来一周的
数据分量很轻:小企业调查、每周失业金申请以及消费者信心。
因此... 阅读全帖

发帖数: 1
26
岗位职责:
1.负责大数据相关产品设计和开发,参与需求分析,系统分析及详细设计
2 负责滴滴数据平台系统的架构&开发,系统承载数据报表、工具平台、数据服务及大
数据可视化相关项目
3.负责数据可视化及数据服务项目架构&开发
任职要求:
1. 研究生或以上学历,计算机相关专业,3年以上工作经验,1年以上大数据相关产
品研发经验
2.JAVA基础扎实,理解io、多线程、集合等基础知识,对JVM原理有一定的了解;
3.熟悉Python/shell等一种或多种脚本语言
4.熟悉大型分布式系统设计与开发,熟悉各种web缓存、消息队列技术原理。在实际项
目中使用过redis、kafka。
5.熟悉MySQL数据库原理及常用优化方法
6.具备良好的工程意识,熟悉git代码管理流程,熟悉maven项目管理工具。
7.熟悉hadoop,有MapReduce开发经验,了解YARN。
8.密切关注大数据相关技术的发展趋势,有hadoop/hbase/Kafka/flume/Zookeeper/
spark/kylin/es等相关技术研究或开发经验者优先
滴滴出行3年多时间,发展到5千人的规模,大数据作... 阅读全帖
C****1
发帖数: 63
27
“双十一”网购狂欢节,商家绞尽脑汁出奇招引客,买家磨拳擦掌拼网速抢货,这就是
一场全民网上盛会。衣食住行,你所能想到的,都作为商品放在了双十一的货品架上。
“科技改变生活”,直到今天这句话才让人有了深刻的理解。
如今,我们的日常生活已经不离开互联网,互联网已经影响改变着我们的日常生活
方式。那么,这种改变究竟有多大?这种联系究竟有多密不可分?
下面一组数据可以说明。
马云更应该感谢男人?!男人才是潜力股
1
中国网购消费者中,男性占55%、女性占45%
大数据揭秘:双十一你将如何“剁手”?
“中国网购消费者中,男性占55%、女性占45%”。在第17届中国杭州西湖国际博览
会重点项目——2015中国(杭州)国际电子商务博览会上,全球著名市场调查公司尼尔
森公布的这项数据让不少人大跌眼镜。这与人们印象中“女性更爱网购”的普遍印象形
成反差,男性网购消费者的占比高于女性10个百分点!
Are you kidding? 网购不是女人的专利吗? (╯ ̄Д ̄)╯
连马云都说过阿里的成功离不开女人。他说,“阿里巴巴70%的买家是女性、55%的
卖家是女性,这是我们主要的资源。所以我要感谢女性,没有你... 阅读全帖
j***h
发帖数: 4412
28
来自主题: SanFrancisco版 - 深度解读美国1月就业数据 (转载)
【 以下文字转载自 CivilEngineering 讨论区 】
发信人: jeffh (Jeffh), 信区: CivilEngineering
标 题: 深度解读美国1月就业数据
发信站: BBS 未名空间站 (Mon Feb 7 15:48:59 2011, 美东)
深度解读美国1月就业数据 2011年2月7日 17:24 世华财讯
[世华财讯]美国1月就业数据一方面是就业增加不尽如人意,另一方面却是失业率快速
下降,但是了解美国就业统计方式之后,你的迷惑就能解开并看到一丝曙光。
综合媒体2月7日报道,冬季老伯(Old Man Winter)绝对使要搞明白美国经济正走向何
方变得更加困难。
全美范围一系列暴风雨在1月用经济数据来体现着浩劫,最终1月就业报告一方面是招聘
增加数让人失望,另一方面是失业率快速下降。
Pierpont Securities首席经济师史丹利(Stephen Stanley)说:“1月的经济严重失
真。”
2月的第一周也没有出现好的开始,中东部地区遭遇大雪,南部陷入严寒。未来一周的
数据分量很轻:小企业调查、每周失业金申请以及消费者信心。
因此... 阅读全帖

发帖数: 1
29
今天看威少加时赛赢了奇才,威少又拿了一个三双,发现威少几乎每两场就一个三双,
而且平均数据也是三双。
这在历史上都是几乎未见,因为这得分这么牛逼。上了三十分。
今天忍不住要吹一下威少,而且是有图有真相的那种有理有据。
威少到目前的数据是这样的。31 10 11 因为没有加后面小数点的位置,所以威少的数
据我还是少说了的。
31分,目前得分榜第二位,牛逼大了。
篮板,竟然上了10,第七位,你让其他内线情何以堪呀。
助攻也是上了11个,目前第二,仅次于胡子。
如果我们把一个助攻算两分的话,这是最少的,那么威少的得分就是53分,球队得分一
半与他有关,还不说篮板,
威少这个数据,在NBA历史综合加权的话是可以排名前三或者第一的。
我们看看最近这些年的一些很牛逼的数据,一个是科比那个35分的赛季,35.3+5.4+4.5
,可是助攻和篮板还是差威少很多。当年科比的得分可是把所有人都吓坏了的。
另外一个是老詹的很牛逼的数据,06年詹姆斯31.4+7+6.6,这个数据得分和威少差不多
,但是其他两样差不少。
所以看到威少这个数据,只能说除了惊讶还是惊讶。
当年保罗MVP第二时候,除了助攻稍微多一... 阅读全帖
d****o
发帖数: 32610
30
【 以下文字转载自 Military2 讨论区 】
发信人: Mayingba (吳鐘學), 信区: Military2
标 题: 什么是战神?看林彪如何用“大数据”指挥作战
发信站: BBS 未名空间站 (Sun Apr 24 00:57:34 2016, 美东)
2016-04-23 时代文摘
不要以为只有互联网才可以大数据,林彪1948年就开始用大数据打敌人的脸。
林彪从红军带兵时起,身上就有个小本子,上面记载着每次战斗的缴获、歼敌数量。每
次打完仗,林彪就亲自往上面添加数字,并为之沾沾自喜,令人感觉到这个23岁任军长
,25岁就当军团长的人,似乎有点小气。
但正是这种坚持正是林彪几乎每战必胜的来源。对于“大数据”的积累和运用,林彪行
军打仗能给我们怎样的启迪?
大数据从收录大量细节信息开始
1948年辽沈战役开始之后,在东北野战军前线指挥所里面,每天深夜都要进行例常的“
每日军情汇报”:由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获
情况。
那几乎是重复着千篇一律枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮
、车辆多少,枪支、物资多少……
司令员林彪的... 阅读全帖
m***e
发帖数: 428
31
2017年05月07日
视频:《新闻1+1》:环保督查,查出“病根”在哪里? 来源:央视新闻
日前,环保部发布对28个城市的督查通报,发现一些痼疾。其中,“花式造假”再
次闯入视线,部分企业在监控设备和监测数据上动起了手脚,有的偷天换日,有的暗度
陈仓,有的企图蒙混过关。
设备上动起歪脑筋
4月19日,环保部通报京津冀及周边大气污染防治强化督查情况,点名数起企业在
设备上动手脚的违法违规行为。
排气筒的实际截面积约有12.5平方米,山东省淄博市淄川区宝山水泥厂“阉割”了
在线监测仪的监测面积,让它只能测到7平方米截面的排放量,导致监控数据与实际严
重不符。无独有偶,河北省南玻玻璃有限公司将二氧化硫在线监测仪的量程上限设定为
195毫克/立方米,上传的数据只能在上限徘徊。
个别企业的造假甚至到了匪夷所思的地步。督查组发现,河北省唐山福海鑫钢铁有
限公司擅自关闭数据采集传输仪,数据无法传输到监控平台;河南省安阳市内黄县丰源
新型材料有限公司二氧化硫在线监测数据甚至为负数。
环保部环境监察局有关负责人表示,当企业的这种行为被揭穿后,“他们往往会辩
解这是设备厂家设置的,与自己无关。”为了封堵... 阅读全帖
c*********e
发帖数: 16335
32
如果table的每行数据是以二叉树结构存在硬盘里,那么我删去一行数据之后,这行的
primary key对应的数据是空的。比如现在有100行数据在一个表里,我删去了
primary key是keyid=5的那一行数据,那么我再加新的一行数据进这个表,新的数据的
keyid应该是5,而不是101,对不对?
但是,在使用mysql之类数据库的时候,现在有100行数据在一个表里,我删去了
primary key是keyid=5的那一行数据,那么我再加新的一行数据进这个表,新的数据的
keyid是101。 这说明数据不是按照二叉树存储在硬盘里的。
到底怎么回事呢?mysql, oracle,sql server,每个数据库软件不一样?
l******o
发帖数: 52
33
【 以下文字转载自 DataSciences 讨论区 】
发信人: laihaobo (数海扬帆), 信区: DataSciences
标 题: 大数据时代的最大挑战(一)?
关键字: 数据挖掘,过度拟合,“大海捞针”回归法
发信站: BBS 未名空间站 (Sun Aug 24 21:55:49 2014, 美东)
挑战一: 数据挖掘者的陷阱或"愚蠢把戏"。
海量数据,"大数据",和高频数据---由 “Big Data” 说开去之二
这个"愚蠢把戏"是直译。见下文:
http://bit.ly/StpdDtMnrTrck
文中有更加强烈的用词,像”evil data miners”,不过也还有的放矢,我们再做解释
。.此文发表于 The Journal of Investing 2007年第1期。大家可以验证一下此文的出
处:
Leinweber, David J. "Stupid data miner tricks: overfitting the S&P 500."
 The Journal of Investing 16.1 (2007): ... 阅读全帖
G********r
发帖数: 3161
34
来自主题: Statistics版 - 请教版上SAS牛人,关于补数据
要提供给人做2D和3D图的数据,每一个Subject有A,B,C,D 4类数据。
原始数据是:subject, code(值是ABCD), value
要做成的数据是:subject, newcode, x, y, z
其中x是x轴,y是y轴,z是z轴,2D的数据z是空的,3D的图,x,y,z都应该有数据。
newcode就是"xxx vs xxx".
A vs B (x axis=A, Y axis=B)
C vs B
D vs B
A vs D (x axis=A, Y axis=D)
B vs D
C vs D
A vs B vs D (x=A, y=B, z=D)
首先请教的问题是,有些Subject不一定ABCD全有,请问这种情况还有必要把数据列出
来么?因为我没做过图,不知道缺一列数据会对结果有什么影响。我本来的理解是如果
少了一列,这个图应该做不出来,所以不用列了,但不是很确定。比如说一个Subject
,只有ACD,没有B,那么2D、3D图的数据里Y列全是空,我是可以不把这个Subject放在
最终的Data里还是必须老老实实地列成如下:
sbj1, A vs B, A... 阅读全帖
G***G
发帖数: 16778
35
给你一大数据,然后你运用大数据,发现了一个有意义的结论。
这个结论被证实。
这个结论不能用传统的小数据分析方法得到。
板上有人能给出一个实例吗?然后介绍用到的大数据的工具。
对不起,我实在不明白什么叫大数据,什么是大数据和小数据的不同。
我的理解是:你用个人电脑分析一个数据,需要1个月的时间,
你用大数据的工具,可能只需要1天的时间。但是1个月的分析也好,1天的分析也好,
两者得出的结论应该是一样的。
也就是说所谓大数据分析,就是省时,但是提高不了预测精度。
另外还有一点,如果数据庞大,如何验证得出的结论呢?
如果验证不了,没人能说你的大数据分析方法是正确的,或者错误的。
而实际上,很多医学数据,大也好,小也好,根本就没有结论。
同一个人在不同时间做的NGS数据,就会很大程度的不一样。数据本身就是不能重现的。
结论如何得出呢?小数据分析都得不出结论,大数据分析更不能了。
并行分布的程序,如何调试呢?不是调试语法错误,是调试数据正确与否。
m***r
发帖数: 359
36
来自主题: DataSciences版 - 大数据日报上线了!
大数据日报 2015-01-28
http://bd.memect.com/archive/2015-01-28/long.html
怎么分析原始的数据? @王威廉
怎么分析原始的数据?预处理大数据时需要注意什么?从编程的角度看,有什么有效方
法?Rochester助理教授Philip Guo写了一篇不错的博文,介绍了不少关于分析数据的
实际建议:http://t.cn/RZuFxaN
回顾:大数据应用与城市空间规划思考(甄峰2013) @城市数据派-UDParty
回头细看13年的规划大数据[good][噢耶]【2013@规划年会 大数据论坛】@南京大学 @
甄峰_NJU 《大数据应用与城市空间规划思考》:规划理论变革-从场所空间向流动空间
的转变;规划数据来源-紧紧抓住大数据这个机遇,从变革规划编制调研手段开始;规
划研究、编制与成果表现。详 http://t.cn/RZue64L
ECS(即Docker on AWS)试用札记 @登州知府
Amazon EC2 Container Service(ECS,即Docker on AWS)试用札记:http://t.cn/RZupMG... 阅读全帖
m***r
发帖数: 359
37
来自主题: DataSciences版 - 大数据日报上线了!
大数据日报 2015-01-28
http://bd.memect.com/archive/2015-01-28/long.html
怎么分析原始的数据? @王威廉
怎么分析原始的数据?预处理大数据时需要注意什么?从编程的角度看,有什么有效方
法?Rochester助理教授Philip Guo写了一篇不错的博文,介绍了不少关于分析数据的
实际建议:http://t.cn/RZuFxaN
回顾:大数据应用与城市空间规划思考(甄峰2013) @城市数据派-UDParty
回头细看13年的规划大数据[good][噢耶]【2013@规划年会 大数据论坛】@南京大学 @
甄峰_NJU 《大数据应用与城市空间规划思考》:规划理论变革-从场所空间向流动空间
的转变;规划数据来源-紧紧抓住大数据这个机遇,从变革规划编制调研手段开始;规
划研究、编制与成果表现。详 http://t.cn/RZue64L
ECS(即Docker on AWS)试用札记 @登州知府
Amazon EC2 Container Service(ECS,即Docker on AWS)试用札记:http://t.cn/RZupMG... 阅读全帖
m***r
发帖数: 359
38
来自主题: DataSciences版 - 大数据日报 2015年2月楼
大数据日报 2015-02-22
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-02-22/short.html
1) 【大数据金融2.0系列:红包大战和移动金融的崛起】 by @36大数据网
关键词:应用, 鲍忠铁, 金融
【大数据金融2.0系列:红包大战和移动金融的崛起】36大数据专稿,作者:鲍忠铁,
转载本文需要得到作者daxiakanke 的授权。  2015年春节,抢风头的不再是春晚小.
. [1] (分享自 @搜狐新闻客户端 )
[1] http://3g.k.sohu.com/t/n38125932
2) 【汲取Linux灵感 Pivotal开源大数据套件】 by @Linuxeden开源社区
关键词:数据库
【汲取Linux灵感 Pivotal开源大数据套件】 Pivotal公司将把旗下大数据套件中的主
要组成部分加以开源,而这正是从Linux发展概念... 阅读全帖
m***r
发帖数: 359
39
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-04
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-04/short.html
1) 【Spark Streaming容错的改进和零数据丢失】 by @CSDN云计算
关键词:计算框架, Spark
【Spark Streaming容错的改进和零数据丢失】实时流处理系统必须要能在24/7时间内
工作,因此它需要具备从各种系统故障中恢复过来的能力。最开始,Spark Streaming
就支持从driver和worker故障恢复的能力。本文将详细描述Spark Streaming容错的改
进和零数据丢失。 [1]
[1] http://www.csdn.net/article/2015-03-03/2824081
2) 【数据可视化常用的五种方式及案例分析】 by @数据挖掘与数据分析
关键词:分析, 可视化
【数据可视化常用的五种方式... 阅读全帖
m***r
发帖数: 359
40
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-04
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-04/short.html
1) 【Spark Streaming容错的改进和零数据丢失】 by @CSDN云计算
关键词:计算框架, Spark
【Spark Streaming容错的改进和零数据丢失】实时流处理系统必须要能在24/7时间内
工作,因此它需要具备从各种系统故障中恢复过来的能力。最开始,Spark Streaming
就支持从driver和worker故障恢复的能力。本文将详细描述Spark Streaming容错的改
进和零数据丢失。 [1]
[1] http://www.csdn.net/article/2015-03-03/2824081
2) 【数据可视化常用的五种方式及案例分析】 by @数据挖掘与数据分析
关键词:分析, 可视化
【数据可视化常用的五种方式... 阅读全帖
m***r
发帖数: 359
41
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-12
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-12/short.html
1) 【Docker的典型应用场景】 by @云创存储
关键词:虚拟化, Docker, 容器
【Docker的典型应用场景】相对于VM,docker在其轻量、配置复杂度以及资源利用率方
面有着明显的优势。 随着docker技术的不断成熟,越来越多的企业开始考虑通过
docker来改进自己的IT系统。本文列举一些docker的实际应用场景,以期能够起到抛砖
引玉的作用…… [1] @专注云计算
[1] http://www.cstor.cn/textdetail_8581.html
2) 【MapR联合创始人:2015年5个大数据技术预测】 by @36大数据网
关键词:计算框架, 应用, Hadoop, John Schroeder
【MapR联合创始人... 阅读全帖
m***r
发帖数: 359
42
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-17
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-17/short.html
1) 【大数据时代的数据存储,非关系型数据库MongoDBs】 by @数盟社区
关键词:数据库, MongoDB, 吴纹羽
【大数据时代的数据存储,非关系型数据库MongoDB】如果将数据库比喻成人类的话,
那么MongoDB完全可以说是神童了,年仅5岁的他单枪匹马挑战一群叔叔级别的人物,并
且按照近几年的发展速度来看,他也即将超越PgSQL成为第四名...via.吴纹羽 [1]
[1] http://dataunion.org/12404.html
2) 【深夜推文: Scaling Docker with Kubernetes】 by @王关胜
关键词:虚拟化, Docker, Kubernetes, 容器
深夜推文: Scaling Docker ... 阅读全帖
m***r
发帖数: 359
43
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-19
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-19/short.html
1) 【Spark RDD API详解(一) Map和Reduce】 by @ghosert
关键词:计算框架, Spark
【Spark RDD API详解(一) Map和Reduce】 RDD是Spark中的抽象数据结构类型,任何数
据在Spark中都被表示为RDD。从编程的角度来看,RDD可以简单看成是一个数组。和普
通数组的区别是,RDD中的数据是分区存储的,这样不同分区的数据就可以分布在不同
的机器上,同时可以被并行处理... [1]
[1] https://www.zybuluo.com/jewes/note/35032
2) 【Docker in Docker】 by @DockerOne
关键词:虚拟化, Docker, 容器, 张磊
【D... 阅读全帖
b*********f
发帖数: 1585
44
连续几天的大雾使北京空气质量再度成为市民关注的话题。昨天,市环保局新闻发言
人杜少中坦言,北京的可吸入颗粒物仍高于国家标准,超标天多是因此而发生。针对官
方公布空气质量数据与美国大使馆数据有出入的问题,杜少中表示,北京有设备监测
PM2.5,愿与美国大使馆比对数据,只是何时公布暂不确定。
可吸入颗粒物超国标20%
杜少中介绍说,国家公布的四项污染物排放指标,北京有三项从2004年就已经稳定
达标,但可吸入颗粒物却比国家指标高出约20%,“1998年可吸入颗粒物年日均浓度为
180微克/立方米,到去年已经下降到年日均浓度121微克/立方米,而国家指标为100微
克/立方米。”可别小看这20%多的超标量,北京95%以上的超标天,也就是让市民感觉
不舒适的天气都是因此发生的。“北京的首要任务是降低可吸入颗粒物,如果能把这20
%减下来,那么北京的空气质量就不是今天的这种状况。”杜少中表示,改善北京的空
气质量当务之急是减少污染物排放,减少燃煤污染、淘汰老旧机动车、控制工地扬尘污
染,这三大污染源都排放可吸入颗粒物。
愿与美国大使馆比对数据
一个是官方公布的数据,一个是美国大使馆的数据,为何出... 阅读全帖
z*m
发帖数: 3227
45
【 以下文字转载自 Military 讨论区 】
发信人: zlm (We will prevail), 信区: Military
标 题: 美方:不会反对中国公布美国城市空气质量数据
发信站: BBS 未名空间站 (Wed Jun 6 04:22:26 2012, 美东)
中国环保部指外国使馆发布的中国空气质量数据是不合规定,美国国务院6号回应说,
美国发布的数据只是为在中国的美国公民提供信息,没有干涉中国内政,因此不会停止
发布相关数据。
中国环保部副部长吴晓青5号就“外国驻华使领馆开展对中国PM2.5监测并且发布数据”
一事指出,“这样做在技术上既不符合国际通行的要求,也不符合中国的要求。根据维
也纳外交关系公约和维也纳领事关系公约,外交人员有义务尊重接受国法律法规,不能
干涉接受国内政。”对此美国国务院否认美国干涉中国内政,并指出美国公布中国部分
城市空气质量数据仅仅是为美国公民提供服务。
记者:你认为发布天气报告没有干涉中国内政?
美国国务院副发言人唐纳:不,我们不这么认为。
记者:你也不认为这违背了维也纳公约?
美国国务院副发言人唐纳:当然不认为。这是为美国人提供的服务... 阅读全帖
c***s
发帖数: 70028
46
在统计数据公布之前几天,有位券商行业的朋友很神秘的说,“我们圈里早知道这个月CPI数据是3.1%。”“你们如何这么肯定呢?是预测的总结吧!”我问。“呵呵,听说他们有渠道。” 经济观察网 孙健芳/文 在统计数据公布之前几天,有位券商行业的朋友很神秘的说,“我们圈里早知道这个月CPI数据是3.1%。”
“你们如何这么肯定呢?是预测的总结吧!”我问。
“呵呵,听说他们有渠道。”
其实不仅仅是券商行业有渠道,在海关数据公布之前,路透社也公布出口增幅近50%的信息,而在去年的统计数据发布会上,路透社记者还质问国家统计局关于统计数据泄漏的问题。
这个朋友在行业中摸爬滚打2年,他告诉了我关于经济数据泄漏的N种情况。
一是部委组织经常组织一些高端会议,会上一些大领导会出席讲话,这些大领导经常随口说出一些经济数据,后来经过仔细琢磨,发现很多数据都是相关单位仍没有公布过。事后问及才知道,在相关数据公布之前要先给一些大领导们过目,大领导们虽然记住了数据,但是并不记得数据发布的日期,所以数据经常会被泄露出来。
除了大领导之外,一些数据系统工作的人士也会在一些交际场合中随口泄露各种统计数据,这些数据在他们看来并
i***s
发帖数: 39120
47
北京市统计局年初披露的数据显示,按常住人口算,去年全市人均GDP达80394元,折合12447美元。这一数据被认为已达到中上等国家水平,接近富裕国家。
上周,国家统计局发布统计公报,经初步核算,中国2011年全年国内生产总值(GDP)471564亿元,比上年增长9.2%。以公报中的去年年末全国大陆总人口134735万人计算,人均GDP约为35000元。
北京市统计局年初披露的数据显示,按常住人口算,去年全市人均GDP达80394元,折合12447美元。这一数据被认为已达到中上等国家水平,接近富裕国家。但与纽约、伦敦、东京等国际大都市相比,北京的人均GDP依然落后很多。另一方面,北京人均GDP数据超出全国人均GDP一倍多,超过多数省份,城乡以及不同地区间的差异明显。这种差异被认为是中国经济未来发展所要面对的重要课题之一。
人均GDP的增长意味着什么?作为普通人是否感受到了这种增长?与发达国家相比,中国GDP成分有哪些区别和优劣?如何改进GDP的增长模式,提升增长质量并缩小地区差异?
北京三产结构较理想
按世行划分标准,北京已达到中上等国家水平,接近富裕国家,服务业占GDP比重达到75.7... 阅读全帖
a****k
发帖数: 3457
48
中国已经到不除汉奸不行地步,这要是在战争期间要就地正法.
苏联卫国战争的胜利和斯大林大清洗据对有关系.
中新网北京6月20日电(记者 尹力)记者20日从北京市人民检察院获悉,国家宏观数据泄
密事件已进入立案侦查阶段。北京市人民检察院反渎职侵权局局长张华伟表示,目前已
对涉及国家宏观经济数据泄密事件的5人进行立案侦查,案件还在进一步侦查之中。
据媒体报道,6月8日,路透社再次抢先发布我国经济数据,预测中国5月份CPI较上年同
期上涨5.4%,将追平3月份创下的32个月高位,与此同时,网络上各位“经济学家”和
各家投资机构乃至网民对于最新宏观经济数据的预测也热火朝天。
与此类似,彭博也在其终端上发布称,经济学家对宏观数据的预测值显示,5月份的中
国CPI同比涨幅为5.5%。据悉,以路透社为代表的外国媒体及相关机构对我国经济数据
的预测准确度相当之高。2008年以来,路透社已经累计7次精准地“猜”对了我国的月
度CPI数据。
中国的核心经济数据屡屡提前“走光”之后,统计局权威发布的公信力受到极大质疑。
最终传出了“内部人员涉嫌泄密”的消息,相关部门随后对数据泄密事件展开调查。
有媒体称,今年... 阅读全帖
b*****d
发帖数: 61690
49
CPI数据泄密涉及5人已被立案侦查
http://www.sina.com.cn 2011年06月20日16:51 中国新闻网
中新网北京6月20日电(记者 尹力)记者20日从北京市人民检察院获悉,国家宏观数
据泄密事件已进入立案侦查阶段。北京市人民检察院反渎职侵权局局长张华伟表示,目
前已对涉及国家宏观经济数据泄密事件的5人进行立案侦查,案件还在进一步侦查之中。
据媒体报道,6月8日,路透社再次抢先发布我国经济数据,预测中国5月份CPI较上
年同期上涨5.4%,将追平3月份创下的32个月高位,与此同时,网络上各位“经济学家
”和各家投资机构乃至网民对于最新宏观经济数据的预测也热火朝天。
与此类似,彭博也在其终端上发布称,经济学家对宏观数据的预测值显示,5月份
的中国CPI同比涨幅为5.5%。据悉,以路透社为代表的外国媒体及相关机构对我国经济
数据的预测准确度相当之高。2008年以来,路透社已经累计7次精准地“猜”对了我国
的月度CPI数据。
中国的核心经济数据屡屡提前“走光”之后,统计局权威发布的公信力受到极大质
疑。最终传出了“内部人员涉嫌泄密”的消息,相关部门随后对数据泄密事... 阅读全帖
w*********g
发帖数: 30882
50
俄罗斯90年代凄惨画面概述编辑本段回目录
更多内容参见关联词条: 扬云飞介绍的俄罗斯社会问题记录片
苏联解体之后,这些基本就都没了。为什么说老叶时代的“五百天计划”比当年大跃
进还要激进?因为这个计划的本质是保留苏联时代社会福利的基础上,将产业和经济模
式转为市场经济模式。但是问题是市场经济必然意味着政府对社会资源支配能力的下降
,欧洲等福利国家都是以高税收的形式,让政府获得足够的资源进行财富二次分配。但
是俄罗斯呢?一方面将国有资产便宜变卖,以便从无到有建立一个资产阶层出来,然后
立刻收回一半以上的税款来?明白这一点,就会明白为什么西方答应的500亿美元的贷
款那么重要。就是说,必须用这些钱在一段时间内(500天),维持俄罗斯新政府在社
会福利方面和政府经费的开支。这样才能保障社会平稳过渡。
虽然今天看起来,就算当时西方给了那些钱,这个异想天开的主意也注定失败。但是
没给的结果是俄罗斯经济往地狱里面多掉下去了十多层。
市场经济对解体后的俄罗斯民众来说,还真是一道考验,严酷的考验。考试的结果是大
概10万人去了天堂,剩下的集体去了地狱.......或许有那么 10%不到的人口留在地球
... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)