由买买提看人间百态

topics

全部话题 - 话题: 关系数据
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)

发帖数: 1
1
在各种媒体经常看到的关键词就包括大数据,数据科学,人工智能,机器人和区域链等
。其实,这些高大上的名词中, 离一般人最近(接地气)的就是数据科学。数据科学
可以理解为一个大概念。它包括侧重理工科的纯数据分析,也包括很实用的商业分析和
营销分析。数据科学的核心就是利用各种量化手段和工具,例如数学,统计学,计量经
济学, 数据挖掘和计算机科学等, 从现有的数据(大数据)中,挖掘发现新知识,以
便用于商业分析和商业决策。 根据2011年美国麦肯锡公司的预测,到2018年美国大概
短缺19万与数据科学有关的工作岗位。您如果到美国有关招聘网站包括领英(LinkedIn
)去搜索一下, 您的确会发现现在有许多数据科学和数据分析的工作机会。由于供求
关系,数据科学的工作岗位给的工资也不低,10万美元年薪很常见。这个工资水平通常
是工程类毕业生工作5年以后才能够拿到的水平。
IT技术的突破,就业市场的靓丽,和媒体的渲染,数据科学这鼓热风吹到各个角落,包
括美国大学。美国大学尤其是私立大学,对市场需求相当敏感。在过去10年, 美国高
校陆陆续续开办200多个研究生层次与数据科学有关的专业。尤其是最近几年... 阅读全帖
m***r
发帖数: 359
2
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-18
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-18/short.html
1) 【数据分析和数据科学的免费在线教程列表】 by @爱可可-爱生活
关键词:分析, 课程, 资源
[教程]数据分析和数据科学的免费在线教程列表,分类精选了26个、共计310多小时的
优秀在线视频教学资源,整理的很有条理,推荐看看 [1]
[1] https://www.mysliderule.com/learning-paths/data-analysis/learn?#88-
capstone-projects
长微博图:http://ww3.sinaimg.cn/large/5396ee05gw1eqa2m8vu5bj20l9789npd.jpg
2) 【Docker最新安全性能调整分析】 by @DockerOne
关键词:虚拟化, Docker... 阅读全帖
l******0
发帖数: 244
3
来自主题: Programming版 - Many-to-Many 关系数据存储
如果想存储所有学生以及学生与学生之间的朋友关系,一个表存学生, 另一个表存朋友
关系。
Student(id, name)
Friend (id_from, id_to)
由于关系是双向的,对每个关系,Friend 里面需要存两次,这样才方便查询。
a->b
b->a
但查询语句需要用到两个 Join.
这种多对多关系的存储和检索,关系数据库里面这是常见的方法吗?
Test here:
http://sqlfiddle.com/#!9/5ec63/1
r*******n
发帖数: 3020
4
现在我们用SQL server;看到mongoDB,就像了解下,
做什么有优势,我们可以采用。
我们数据库存了大量的从设备采集来的数据, 数据结构类似:
{timestamp, value, name}
s********k
发帖数: 6180
5
做数据中心的energy management?肯定是data import和analysis分开,应该会有专门
的local sever和cloud,local server只做暂存和data import,肯定不属于于一次写
多次读吧,搞不好写的次数比读的次数还多(如果local做了很多处理,传到cloud的数
据量应该会小一些),cloud还是得用SQL了。
我们做的产品很像,我们是local用sqllite+SQAacademy, cloud做的是postgreSQL。
SQL只要做好cache其实性能不差的,你们的应用应该是数据量大,但是可能burst不明
显的,这样比较规律的数据优化好SQL肯定可以搞。
s*****n
发帖数: 5488
6
Foursquare uses MongoDB. So I would say performance is not an issue.
mongoDB的数据最后悔比mysql 大。可能又3倍以上。foursquare用两台70G的server就
搞定了。
用不用mongoDB还要看你们的需要。例如数据是不是schemaless.
比如timestamp, sensor, value, tag格式。
如果说value或者需求会经常变化,以location为例,
可以是gps location or wifi
一个是
lan/lat, accuracy,bearing, speed
一个只有ll+ accc
或者有将来扩展的需求,例如bluetooth location
或者是经常被tag,tag一些trace, debug info.
例如tag calling locID = {stream}
这样用mongoDB会很灵活。
否则的话,mysql很好用了。
l******0
发帖数: 244
7
来自主题: Programming版 - Many-to-Many 关系数据存储
NO-SQL 更简单吗?
关系数据库里面典型的多对多关系,这里用 SQL 也很好吧?
p******a
发帖数: 156
8
来自主题: EB23版 - 新的数据,新的分析
这个和是否乐观没有关系。数据告诉我们2009财年处理了30000+的eb2ci,以及2010财
年需要处理
33000的eb2ci。
在这两个数字的前提下,我的推理应该不算太野心。
d******e
发帖数: 2265
9
来自主题: Database版 - ACCESS的数据量求教
关系数据?
r*******n
发帖数: 3020
10
设备会很多,多数是sensor,数据量会比较大并且同时进来。
如果mongoDB吞吐能力强并且占用硬盘空间小,我们可以把它作为中转站,再二次处理
放到SQL server里供分析用,
同时也可作为数据备份用。
MySql肯定能做, 想看看mongoDB是不是更合适。

nosql
a****y
发帖数: 1035
11
来自主题: Statistics版 - 小问题:请问如何分析这个数据?
我想调研教练带队比赛的成绩和教练的技能以及人是否nice之间的关系。
数据是这样的,有15个教练,此赛季中每个教练有一个累积的赛季成绩(continuous
outcome),即15个分数
请来50个人,要求每个人给每个教练的技能和nice程度打分,从1分到5分,比如,你认
为教练的技能应该打几分,5分表示最好,1分表示很差。
所以这两个covariates 均能看成 categorical variable。
这样就是每个人对15个教练打分
我的想法是:如果发现每个人打分的主观判断标准不同,就需要fit linear random
effect model, 将50个人考虑成random effect。
不知道对不对,请大小牛门拍砖指教!!
谢谢先:)
k*******l
发帖数: 698
12
来自主题: Military版 - 一些国际政治经济趣味数据
1、世界上实行免费医疗的国家完全免费:瑞典、挪威、文莱、卡塔尔、古巴、老挝基
本免费:芬兰、新西兰、斯威士兰、阿联酋、科威特、丹麦
曾经免费后取消免费:冰岛、阿根廷、希腊、菲律宾、斐济、瑙鲁、捷克、斯洛伐克、
匈牙利、罗马尼亚、保加利亚、波兰、德国、阿尔巴尼亚、蒙古、波斯尼亚和黑塞哥维
纳、克罗地压、马其顿、黑山、塞尔维亚、科索沃、斯洛文尼亚、乌克兰、白俄罗斯、
俄罗斯、乌兹别克斯坦、哈萨克斯坦、立陶宛、爱沙利亚、拉脱维亚、摩尔多瓦、亚美
尼亚、土库曼斯坦、塔吉克斯坦、阿塞拜疆、格鲁吉亚、吉尔吉斯斯坦、越南
注:
朝鲜——为“政治身份区隔福利制”,很难进行是否免费的划分
新西兰、卡特尔——世界上仅有的两个对境内外籍人免费医疗的国家
2、世界上国内武装冲突最频繁的国家(1990年代——2013年)
年均国内武装冲突超过1000次:苏丹、南苏丹、布隆迪、阿富汗、马里
年均国内武装冲突500——1000次:贝宁、莱索托、科索沃、波黑、多哥
年均国内武装冲突100——500次:伊拉克、塞尔维亚、巴基斯坦、中非共和国、乌干达
、卢旺达、海地、印度、哥伦比亚、尼泊尔、俄罗斯、叙利亚、伊拉克、阿塞拜... 阅读全帖
m***r
发帖数: 359
13
来自主题: DataSciences版 - 大数据日报 2015年2月楼
大数据日报 2015-02-05
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-02-05/short.html
1) 【大数据解决方案:国美在线Apache Hadoop的大数据平台】 by @中国云计算论坛
关键词:计算框架, Hadoop
【大数据解决方案:国美在线Apache Hadoop的大数据平台】·Hadoop数据仓库有效实现
数据整合,存储商品数据、用户数据、交易数据、库存数据、物流数据等的最实时数据
。通过大数据平台的实时SQL分析引擎关 联分析,更加高效、快速、全面的生产业务报
表 [1]
[1] http://www.thebigdata.cn/Hadoop/13398.html
2) 【手把手教你用Docker部署一个MongoDB集群】 by @DockerOne
关键词:数据库, 虚拟化, Docker, MongoDB, 容器
【手把手教... 阅读全帖

发帖数: 1
14
脸书近7000页的内部机密文件被泄露,内容涵盖其如何将用户数据作为谈判筹码来巩固
这家社交巨头的统治地位,如何计划监视Android用户的位置,如何控制竞争对手,甚
至在孵化前杀死竞争对手。文件中一些被标注为高度机密,来自2011年至2015年脸书快
速崛起的时期。这份文件是脸书垄断行为的“自白书”,给政府执法部门提供了进一步
调查的切入点和实实在在的证据。
脸书公司正在尽其所能阻止这些文件在互联网上传播。但在社交媒体时代,这种努力是
徒劳的。这些文件最早在一年前已经被小部分披露,如今则成了脸书版的“维基解密”
,被全球脸书批判者剖析。其中,至少有四点令人警惕。
第一是脸书将用户数据视为“自有资产”,用此来要挟、施压其合作伙伴,而一旦合作
关系破裂,则将阻断这些公司继续获取其数据信息。
第二是“隐私条款”成为脸书封闭数据资源、打压竞争对手的主要手段。此外,脸书还
将部分初创企业列为“潜在竞争对手”,阻止其在脸书上投放广告。
第三是脸书有意组建用户数据的横向和纵向垄断组织。“用户数据”也是脸书引诱其他
巨头的重要手段。例如,由于亚马逊在脸书上投入巨额广告,脸书即允许其访问部分用
户数据。... 阅读全帖
a******e
发帖数: 1036
15
东亚人主体的父系远祖——O人群
东亚真正的主体是NO人群。
NO是K的一个分支,大致在3.5万年前进入,并在3万年前左右分化成N和O两个姊妹类型。
NO到达东亚时,东亚地区已经为C3所占据,但NO类型在很短时期内就成功的取代了C3,
成为了东亚的主人。
NO是最原始NO原始人群的类型,出现在以下人群中:达斡尔族2.6%、鄂温克族3.82%、
赫哲族2.2%、回族2.9%,华北汉族2.3%,华南汉族2.5%,越南人3.1%,外蒙古人0.7%、
布依族5.7%、日本人2.1%、韩国人2.3%、彝族人2.3%,Bama瑶族2.9%。
N、O的分布在黄种人差异巨大。对东亚黄种人而言,O比N多得多,而对北亚黄种人而言
,只有N而无O,对于泰国以南的黄种人而言,只有O而无N。
O类型分为很多类型,主要有O*、O1、O2*、O2a、O2b、O3等。
O*在是O的原始类型,在东亚只是零星的低频率找到,比如Hammer和XUE的数据中,共有
以下民族中找到过最古老的O*:满族5.8%、壮族5.0%、外蒙古人0.7%、藏族1.0%、达斡
尔族2.6%、鄂伦春族3.2%、兰州汉族2.9%、黎族5.7%,在l... 阅读全帖
z**********e
发帖数: 22064
16
扫煤才子 于 2008-4-16 23:36:12 发布在 凯迪社区 > 猫眼看人
伪造数据和伪造历史的张宏志──《“大跃进饿死三千万人”纯属捏造》分析

看到这篇文章很久,实际上,在网络上一搜,轻易就能搜到不少的网页。对于这篇
文章,对“三年饥荒”感兴趣的朋友不会陌生,但是这篇文章,除了各种谎言和假设外
,并没有什么实质意义,但是,却是广大毛卫兵同志最喜欢引用的文章。这里,在下对
文章做个简单的分析,并且指出张宏志同志可笑但全无用处的伪造数据和若干制造假象
,隐瞒真相的地方,以雪亮你们的双眼。
在分析的开始,我先给大家看一张表:
│   │年末总数人口 │ 出生率 │  死亡率   │自然增长率   │
│年份 │  (万人) │ (‰) │  (‰)   │  (‰)   │
│1957 │ 64,653  │ 34·03  │  10·80    │ 23·23    │
│1958 │ 65,994  │ 29·22  │  11·98    │ 17·24    │
│1959 │ 67,207  │ 24·78  │  14·59    │ 10·19    │
│1... 阅读全帖
z**********e
发帖数: 22064
17
【 以下文字转载自 Military 讨论区 】
发信人: zhonghangyue (中行说), 信区: Military
标 题: [原创]伪造数据和伪造历史的李宏志
发信站: BBS 未名空间站 (Sun Jun 5 18:06:34 2016, 美东)
扫煤才子 于 2008-4-16 23:36:12 发布在 凯迪社区 > 猫眼看人
伪造数据和伪造历史的张宏志──《“大跃进饿死三千万人”纯属捏造》分析

看到这篇文章很久,实际上,在网络上一搜,轻易就能搜到不少的网页。对于这篇
文章,对“三年饥荒”感兴趣的朋友不会陌生,但是这篇文章,除了各种谎言和假设外
,并没有什么实质意义,但是,却是广大毛卫兵同志最喜欢引用的文章。这里,在下对
文章做个简单的分析,并且指出张宏志同志可笑但全无用处的伪造数据和若干制造假象
,隐瞒真相的地方,以雪亮你们的双眼。
在分析的开始,我先给大家看一张表:
│   │年末总数人口 │ 出生率 │  死亡率   │自然增长率   │
│年份 │  (万人) │ (‰) │  (‰)   │  (‰)   │
│1957 │ 64,653  │ 3... 阅读全帖
M******a
发帖数: 6723
18
2016-08-25 仲伟民 邱永志 青年史学家 微信号qinianshixuejia
功能介绍
欢迎关注青年史学家!我们将本着“文不虚发”的原则,提倡紧扣前沿、促进交流,探
索公众史学发展路径,服务史学青年、体现现实关怀。青史出品,必属精品!希望大家
支持我们,踊跃投稿,共同进步!
数据估算与历史真实
中国史中GDP估算研究评述
主编
仲伟民:清华大学历史系教授、博士生导师。《清华大学学报》常务副主编。曾经担任
《中国社会科学》与《历史研究》编审、总编室主任,《中国社会科学文摘》常务副主
编。
仲伟民清华大学历史系教授博士生导师
摘要
近年来,中国史中GDP的估算研究引起了学界的高度关注,并由此引起了热烈讨论。关
于国民所得、国民收入等宏观经济核算的研究,最早可追溯至上个世纪三四十年代,学
人多承认由巫宝三等人率先开创。此后,关于这一方面的研究成果不断,但估算研究时
段主要集中在中国的近现代史。最早把GDP估算研究带入中国古代史领域的是外国学者
保罗·贝洛赫、安格斯·麦迪森等人,但是他们较为粗略式的估算引起了学界不断的质
疑,并直接或间接地促成了此次古代经济史... 阅读全帖
p*l
发帖数: 270
19
【 以下文字转载自 Programming 讨论区 】
发信人: phl (--), 信区: Programming
标 题: 数据的游戏:冰与火 (zz)
发信站: BBS 未名空间站 (Wed Jul 31 11:06:08 2013, 美东)
数据的游戏:冰与火
2013年7月31日陈皓

我对数据挖掘和机器学习是新手,从去年7月份在Amazon才开始接触,而且还是因为工
作需要被动接触的,以前都没有接触过,做的是需求预测机器学习相关的。后来,到了
淘宝后,自己凭兴趣主动地做了几个月的和用户地址相关数据挖掘上的工作,有一些浅
薄的心得。下面这篇文章主要是我做为一个新人仅从事数据方面技术不到10个月的一些
心得,也许对你有用,也许很傻,不管怎么样,欢迎指教和讨论。
另外,注明一下,这篇文章的标题模仿了一个美剧《权力的游戏:冰与火之歌》。在数
据的世界里,我们看到了很多很牛,很强大也很有趣的案例。但是,数据就像一个王座
一样,像征着一种权力和征服,但登上去的路途一样令人胆颤。
数据挖掘中的三种角色
在Amazon里从事机器学习的工作时,我注意到了Amazon玩数据的三种角色。
D... 阅读全帖
p*l
发帖数: 270
20
来自主题: Programming版 - 数据的游戏:冰与火 (zz)
数据的游戏:冰与火
2013年7月31日陈皓

我对数据挖掘和机器学习是新手,从去年7月份在Amazon才开始接触,而且还是因为工
作需要被动接触的,以前都没有接触过,做的是需求预测机器学习相关的。后来,到了
淘宝后,自己凭兴趣主动地做了几个月的和用户地址相关数据挖掘上的工作,有一些浅
薄的心得。下面这篇文章主要是我做为一个新人仅从事数据方面技术不到10个月的一些
心得,也许对你有用,也许很傻,不管怎么样,欢迎指教和讨论。
另外,注明一下,这篇文章的标题模仿了一个美剧《权力的游戏:冰与火之歌》。在数
据的世界里,我们看到了很多很牛,很强大也很有趣的案例。但是,数据就像一个王座
一样,像征着一种权力和征服,但登上去的路途一样令人胆颤。
数据挖掘中的三种角色
在Amazon里从事机器学习的工作时,我注意到了Amazon玩数据的三种角色。
Data Analyzer:数据分析员。这类人的人主要是分析数据的,从数据中找到一些规则
,并且为了数据模型的找不同场景的Training Data。另外,这些人也是把一些脏数据
洗干净的的人。
Research Scientist:研究科学家。这种角色... 阅读全帖
M******a
发帖数: 6723
21
【 以下文字转载自 Military 讨论区 】
发信人: Mayingba (吳鐘學), 信区: Military
标 题: 仲伟民:数据估算与历史真实——中国史中GDP估算研究评述
发信站: BBS 未名空间站 (Tue Aug 30 14:18:19 2016, 美东)
2016-08-25 仲伟民 邱永志 青年史学家 微信号qinianshixuejia
功能介绍
欢迎关注青年史学家!我们将本着“文不虚发”的原则,提倡紧扣前沿、促进交流,探
索公众史学发展路径,服务史学青年、体现现实关怀。青史出品,必属精品!希望大家
支持我们,踊跃投稿,共同进步!
数据估算与历史真实
中国史中GDP估算研究评述
主编
仲伟民:清华大学历史系教授、博士生导师。《清华大学学报》常务副主编。曾经担任
《中国社会科学》与《历史研究》编审、总编室主任,《中国社会科学文摘》常务副主
编。
仲伟民清华大学历史系教授博士生导师
摘要
近年来,中国史中GDP的估算研究引起了学界的高度关注,并由此引起了热烈讨论。关
于国民所得、国民收入等宏观经济核算的研究,最早可追溯至上个世纪三四十年代... 阅读全帖
m***r
发帖数: 359
22
来自主题: DataSciences版 - 大数据日报 2015年2月楼
大数据日报 2015-02-22
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-02-22/short.html
1) 【大数据金融2.0系列:红包大战和移动金融的崛起】 by @36大数据网
关键词:应用, 鲍忠铁, 金融
【大数据金融2.0系列:红包大战和移动金融的崛起】36大数据专稿,作者:鲍忠铁,
转载本文需要得到作者daxiakanke 的授权。  2015年春节,抢风头的不再是春晚小.
. [1] (分享自 @搜狐新闻客户端 )
[1] http://3g.k.sohu.com/t/n38125932
2) 【汲取Linux灵感 Pivotal开源大数据套件】 by @Linuxeden开源社区
关键词:数据库
【汲取Linux灵感 Pivotal开源大数据套件】 Pivotal公司将把旗下大数据套件中的主
要组成部分加以开源,而这正是从Linux发展概念... 阅读全帖
z*m
发帖数: 3227
23
【 以下文字转载自 Military 讨论区 】
发信人: zlm (We will prevail), 信区: Military
标 题: 环保部:希望个别驻华使馆停止发PM2.5数据
发信站: BBS 未名空间站 (Tue Jun 5 02:59:19 2012, 美东)
“大家可能注意到,北京、上海发布的PM2.5监测数据,与个别领事馆发布的监测数据
日均值是基本一致的,但评价结果相差很大,主要原因是他们用本国的空气质量标准来
评价我国的空气质量,这是明显不合理的。”
________________________________________________________
中新网6月5日电 今天是世界环境日,环保部副部长吴晓青在国务院新闻办召开新闻发
布会表示,外国驻华使领馆开展对我国PM2.5监测并且发布数据,做在技术上既不符合
国际通行的要求,也不符合中国的要求,既不严谨,也不规范。希望个别驻华领事馆尊
重我国相关法律法规,停止发布不具有代表性的空气质量信息。
不合法也不合规
吴晓青说,从法律上讲,中国环境保护法和大气污染防治法等有关法律规定,国务... 阅读全帖
z*m
发帖数: 3227
24
【 以下文字转载自 Military 讨论区 】
发信人: zlm (We will prevail), 信区: Military
标 题: 环保部:希望个别驻华使馆停止发PM2.5数据
发信站: BBS 未名空间站 (Tue Jun 5 02:59:19 2012, 美东)
“大家可能注意到,北京、上海发布的PM2.5监测数据,与个别领事馆发布的监测数据
日均值是基本一致的,但评价结果相差很大,主要原因是他们用本国的空气质量标准来
评价我国的空气质量,这是明显不合理的。”
________________________________________________________
中新网6月5日电 今天是世界环境日,环保部副部长吴晓青在国务院新闻办召开新闻发
布会表示,外国驻华使领馆开展对我国PM2.5监测并且发布数据,做在技术上既不符合
国际通行的要求,也不符合中国的要求,既不严谨,也不规范。希望个别驻华领事馆尊
重我国相关法律法规,停止发布不具有代表性的空气质量信息。
不合法也不合规
吴晓青说,从法律上讲,中国环境保护法和大气污染防治法等有关法律规定,国务... 阅读全帖
z*m
发帖数: 3227
25
【 以下文字转载自 Military 讨论区 】
发信人: zlm (We will prevail), 信区: Military
标 题: 环保部:希望个别驻华使馆停止发PM2.5数据
发信站: BBS 未名空间站 (Tue Jun 5 02:59:19 2012, 美东)
“大家可能注意到,北京、上海发布的PM2.5监测数据,与个别领事馆发布的监测数据
日均值是基本一致的,但评价结果相差很大,主要原因是他们用本国的空气质量标准来
评价我国的空气质量,这是明显不合理的。”
________________________________________________________
中新网6月5日电 今天是世界环境日,环保部副部长吴晓青在国务院新闻办召开新闻发
布会表示,外国驻华使领馆开展对我国PM2.5监测并且发布数据,做在技术上既不符合
国际通行的要求,也不符合中国的要求,既不严谨,也不规范。希望个别驻华领事馆尊
重我国相关法律法规,停止发布不具有代表性的空气质量信息。
不合法也不合规
吴晓青说,从法律上讲,中国环境保护法和大气污染防治法等有关法律规定,国务... 阅读全帖
m******8
发帖数: 2153
26
2010年的美国人口普查数据显示,最近20年以来,美国同性恋伴侣家庭的数量呈显著增
长趋势,许多同性恋伴侣家庭也从传统的“同性恋聚居地”分散到了范围更广的全美各
地城镇。
到本周为止,美国人口普查局已陆续公布了去年普查所获得的各州人口最新数据,
加州大学洛杉矶分校威廉姆斯学院(Williams Institute)的人口统计学专家分析了普
查数据中同性恋伴侣的分布情况,为人们提供了有史以来最清晰的、有据可依的相关数
据全景图,尽管目前的普查数据在技术上还不能完全准确和全面的反映同性恋家庭的真
实全貌。
根据普查数据,目前已被统计的全美各地同性恋配偶的总数为901,997对,比十年
前增加了50%。不仅在绝对数量上有明显增加,同性配偶的地理分布也正呈现分散化趋
势,而不是多年前集中于被认为是“同性恋聚居地”的少数一些城市,一些老年同性伴
侣更愿意选择到自己喜爱的小城市定居,因为很多小城市的社会已不再像从前那样观念
保守。
近年来,同性恋者被社会接纳和认可的程度已发生了巨大变化,已有越来越多的同
性恋者愿意公开性倾向或公开与同性伴侣的关系,人口普查所呈现的同性伴侣增多的现
象似乎反映了这一... 阅读全帖
H****g
发帖数: 14447
27
大数据时代的“中国梦”——共识网专访涂子沛
发布时间:2012-07-24 08:19 作者:嘉宾:涂子沛 |采访人:杨传银、郑子蒙 字号:大
中 小 点击: 6398次
涂子沛在接受共识网专访 (郑子蒙 / 摄)
嘉宾简介:涂子沛,信息技术从业者,多家报刊网站专栏作家,华南理工大学公共
政策研究院副教授。曾在国内的公共部门和信息领域工作十年,后辞去公职赴美读书,
获卡内基梅隆大学信息技术科学硕士、公共管理硕士学位。新著有《大数据:正在到来
的数据革命》一书,已由广西师范大学出版社出版。
访谈时间:2012年7月2日下午
访谈地点:广西师范大学出版社(北京贝贝特出版顾问有限公司)
一、大数据:正在到来的数据革命
杨传银:您写《大数据:正在到来的数据革命》这本书的初衷在哪里?您说这不是
一本纯粹谈技术的书,而是以技术为背景探讨人和社会的关系的书,这个观察和写作的
角度是从什么时候开始建立的?
涂子沛:这本书应该说是时代浪潮的一个产物。我是理工科出身,大学毕业后我的
第一份工作就是数据库程序员。十几年之后,我在美国的第一份工作是数据仓库程序员
,从数据库变成了数据仓库,这也是我们从小数据... 阅读全帖
z****u
发帖数: 241
28
来自主题: JobHunting版 - 纽约时报:大数据时代降临
老土早就指出: 懂数据会分析哪都要,钱不少活的好干到老.
English version on New York Times: The Age of Big Data
By STEVE LOHR
Published: February 11, 2012
http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impac
纽约时报:大数据时代降临
导读:《纽约时报》网站今天刊载文章称, “大数据时代”已经降临,在这一领域
拥有专长的人士正面临许多机会。文章指出,“大数据”正在对每个领域都造成影响。
举例来说,在商业、经济及其他领域 中,决策行为将日益基于数据和分析而作出,而
并非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预
见能力也已经崭露头角。以下 是这篇文章的全文。
你在数字方面很拿手?数据令你感到着迷?那么你听到的声音是机会正在敲门。
作为一名刚刚毕业的耶鲁大学MBA(工商管理硕士),周默(音译)在去年夏天被IBM抢
聘,加入了该公司迅速增长中的数据顾问团... 阅读全帖
a**i
发帖数: 608
29
来自主题: Quant版 - 南开校友团经济数据泄密案
*****************
此贴不敢转到南开板去, hehe。
不过从另一方面体现出: 南开经济学院还是很牛的,校友很多混得不错。
***************
经济数据泄密案 涉南开校友团
2名被告人为博士 14名获密人为其校友 绝大多数任职于证券行业 分析称有利益驱动
记者独家获悉,轰动一时的"泄露经济数据系列案"的第4起已宣判。西城法院以故
意泄露国家秘密罪判处国信证券公司宏观经济分析师林松立有期徒刑6个月,缓刑1年。
已判决的4起案件中的3起系串案,其中2名被告人是毕业于南开大学经济学院的博
士,泄密对象包括其14名南开校友,这些人均为经济学科背景,绝大多数任职于证券公
司等金融企业。
伍超明案
发短信泄密 半年内传给15人
被告人之一伍超明,1973年生人,南开大学虚拟经济研究方向博士。博士在读期间
,他曾获南开"十大杰出青年"称号。
毕业后,伍超明被中国人民银行录用,虽然编制在金融研究所货币金融史研究室,
但一直被借调在研究局宏观经济研究处,后者是掌握宏观经济数据的核心部门。
宏观经济研究处处长纪敏证实,伍超明实际履行的是副处长的职责,协助自己进行
宏... 阅读全帖
c***s
发帖数: 70028
30
提前获得宏观经济数据究竟如何从中渔利,这一“潜规则”日前终于被揭开一角。
有媒体报道,今年的几次经济数据泄密事件引起了政府高层的重视。在3月底,有宏观部门的涉及人员相继落马。该报道引述消息人士的话说,国家统计局办公室和中国人民银行研究局的一些人员已经相继离岗。
直到6月4日晚间,被涉传闻的有关部门还没有对这一消息的真实性做出官方正面回应。据了解,其他金融监管部门已经在内部开展信息安全教育。
有知情人士对记者透露,这是相关部门所实施的针对经济数据泄露情况的跨部门调查所牵出的事件,调查已进行数月。
惊人预测力从何来
每个月,中国的券商、研究机构都在热闹地进行宏观经济数据的竞猜,时时有机构能精准猜中。
比较戏剧化的“竞猜”发生在今年3月。当时,由于央行在2月份春节假期的最后一天宣布加息,业内普遍预计1月份CPI可能破5%才迫使央行采取行动。但在数据发布前的2月14日,有外媒通讯社援引两位市场人士的话说,由于中国官方调整了2011年CPI的权重,中国1月CPI同比上涨4.9%,环比涨幅约在 0.9%,低于市场的普遍预期。等到2月15日国家统计局网上公布经济数据时,其中的CPI数据正是4.9%。... 阅读全帖
w*********g
发帖数: 30882
31

再开就是货币快速贬值人民币国际化见鬼,不开就是泡沫破裂。
=======================================
2017年之中国经济:开不动的印钞机
2017年10月21日 | Filed under: 经济观察 | 来源: 看中国

先让我们从下面这样一组数据开始:
2013年初,中国央行“对其它存款性公司债权”(央行借给商业银行的债)规模为1.45
万亿(人民币,下同)。当年6月,钱荒发作,各商业银行的现金流濒临断裂,全社会
陷入恐慌。央行紧急启动“SLF”、“MLF”等方式,直接借钱给商业银行,补充商业银
行的现金流。至2014年底,央行对其它存款性公司债权的规模为2.50万亿,2015年底为
2.66万亿。这两年央行在借钱给商业银行的问题上,算得上极尽克制,两年时间加起来
也就是借了1.21万亿出去。然而到2016年底,该数据暴增到8.47万亿,较2015年底暴增
了5.81万亿,增幅高达218%(注:本文的数据已更新到2017年8月份)。
到2017年,这种令人震惊的增幅突然就停止了。6月底的数据为8.59万亿,较2016年底
... 阅读全帖
l****z
发帖数: 29846
32
来自主题: USANews版 - 中情局被指向AT&T购买元数据
据政府官员透露,中央情报局(CIA)目前每年支付美国电话电报公司(AT&T)逾1000万美
元(约合6092万元人民币)的费用,利用该公司庞大的通话记录数据库协助海外反恐调
查,其中包括美国人的国际通话记录。
官员们透露,这种合作是依据自愿达成的合同进行的,CIA并没有通过发传票或法院命
令迫使该公司参与。官员们还表示,CIA提供海外恐怖主义嫌犯的电话号码,AT&T则搜
索自己的数据库,提供通话记录,这些记录可能有助于确认外国同伙的身份。该公司拥
有庞大的国内外通话记录数据库,其中包括所有经由其网络设备处理的通话,不仅是该
公司用户的通话。
该项目为有关政府监控及通讯记录隐私的争论提供了新的内容,最近几个月,这一争论
的焦点一直是美国国家安全局(National Security Agency,简称NSA)的项目。CIA项
目的曝光进一步揭露了情报官员与通讯服务供应商的关系,说明了NSA之外的机构如何
通过一些项目利用元数据——有关通话日期、持续时间及电话号码的记录,而不是通话
内容——来分析人与人之间的关系,规范这些项目的法律标准、程序及监督工作相互矛
盾。
官员们称,CIA无权监控... 阅读全帖
d********w
发帖数: 363
33
来自主题: JobHunting版 - 后Hadoop时代的大数据架构
http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖
d********w
发帖数: 363
34
来自主题: JobHunting版 - 后Hadoop时代的大数据架构
http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖
f****i
发帖数: 9419
35
你就不懂在那里胡说,继续。扯什么的淡呢?唐朝贞观元年到贞观四年还连续四年大旱
呢,为什么就说丁戊奇荒是有名的大灾,贞观元年那次没算?你知道灾荒旱灾水灾蝗灾
等都不一样,如果轮番上阵更不一样,在什么地区不一样,是不是在同样地区连续受灾
也不一样?你知道91年到95年的所谓连续受灾是什么情况?你就不能查查资料去?张嘴
就凭着你的立场和屁股位置胡说?
还老天爷很明白,这三年不算什么?真是啥都当游戏数字看了。另外告诉你,这篇文章
后面还有,只是我选了灾情部分,后面讨论的是人祸部分,最终人家定性的是有人祸,
有天灾。这么大的灾荒不算什么,搞笑了。再给你转一个文章,里面也是各种应用数据
都是表明了出处的,你不相信就去查原始资料。
1959-1961年全国干旱灾害探讨述评
一、灾害状况与灾情概述
1.灾害状况
发生在20世纪50年代末60年代初的全国性旱灾,从气象、水文、农业、民政和统计
部门记录的原始资料文献看,这是建国以来第一场连续多年的干旱灾害。按照国家气象
局分析发布和出版的权威性资料文献[1],水利部统计归纳的资料和研究出版的专著[2]
,国家统计局和民政部汇编的《中国灾情报告》[3],概... 阅读全帖
d**********i
发帖数: 2036
36
3.1.2.3 长期担任计划生育委员会副主任的著名人口砖家蒋正华是骗子
(1) 蒋正华是饿死三千万谎言的始作俑者
改革开放之初,在一股强大的逆流推动下,各种反毛反社反共的谣言相继出台,其中影
响最大的一类正是所谓的“饿死三千万”(在上世纪六十年代初,新中国遭遇三年困难
时期期间因粮食短缺而造成的人口非正常死亡)。这一谣言在海内外的学界、媒体、官
方的合谋下广泛地传播开来,负面影响极大,至今也是攻击毛主席和中国社会主义制度
的主要口实。最夸张的是杨继绳的《墓碑》,把“饿死人”数字夸大到七千万。在这个
谣言制造和传播的过程中,有两件事情起着重要的作用,一个是国家统计局1983年公布
的人口数据中存在的重大矛盾,另一个就是蒋正华的研究。
杨继绳的文章《大饥荒期间中国的人口损失》。(http://www.douban.com/note/17847211/)在“蒋正华的研究”中问道“为什么蒋正华同一种方法得出3组不同数据?为什么提出与前一组数据不同的数据时,不作为什么不同的说明?为什么用他提供的数据计算,得出的结果都远远超过他的1700万的结论?”对此,蒋正华在回信说:“因我手头没有详细资料,许... 阅读全帖
s******a
发帖数: 407
37
近日,三季度经济数据出炉,除了备受关注的GDP增长数据之外,减税降费也成为舆论
焦点。财政部日前发布数据显示,9月全国一般公共预算收入中的税收收入8243亿元,
同比下降0.7%,该数据是自2015年2月以来的首次下降。这表明国务院提倡的为企业减
负初见成效,也符合李总理多次强调的:“我们给企业减税降费,同样是积极的财政政
策!”(10月31日中国政府网)。
应该承认,李总理提出的“给企业减税降费同样是积极财政政策”的观点十分
正确,符合我国当前客观经济运行实际。因为目前我国企业确实存在税负过高、国企与
民营中小微企业税负不公等问题,严重制约了经济发展,确实需要政府积极主动为企业
减税降费。而给企业减税降费等于是给企业直接“输血”,帮助企业恢复“造血”机能
,有利于提振中小微企业经营盈利能力,最终抑制住经济下行趋势,使中国经济继续成
为世界经济“引擎”。
而从目前现实看,国务院出台实施对企业减税降费的各项政策已产生效力,企
业总体税赋水平有所降低;尤其今年从2016年5月1日全面推开营改增试点以来,前8个
月累计减税2493亿元,预计今年全年将比改革前减轻... 阅读全帖
t******n
发帖数: 2939
38
来自主题: WaterWorld版 - [合集] 中间派看韩方之争
☆─────────────────────────────────────☆
puremj (puremj) 于 (Sun Jan 29 21:33:12 2012, 美东) 提到:
之前对2人都不感冒并多少有些抵触!
这2天韩方之斗铺天盖地,充斥各个论坛,我几乎阅读了所有劲爆的帖子与相关的
博客,我现在很明显地站在方舟子这边,理由如下:
1:单从文学/学术甚至辩论的角度来看,方舟子明显有理有力有据,不管事情的来
龙去脉究竟怎样,方舟子罗列的疑点说服了我这个中间派,而韩寒的回复一方面没有澄
清这些一点,倒是展示了其深厚的骂功;
2:从韩与方的支持者的发言以及回复来看,绝大韩粉们不是去论证方舟子的疑点怎
么滑稽荒唐,而是用下三滥的咒骂大搞人身攻击;而大多数方的支持者们绝对是忍气吞
声,摆事实讲道理;
3:我也希望韩是被冤枉的,但他必须给出信服的证据,上电视或者网络直播辩论是
个很好的平台,可以理解满腹经纶却言语木讷,但不能再用“忘记了”这样的台词来装
4:韩寒应该有点小小才艺(绝非天才),但从目前的情况来看,三重门/书店的写作
确实有些问题,从... 阅读全帖
d**********i
发帖数: 2036
39
3.1.1.5 剩女、剩男问题的量化简析
人生在世所追求的无外乎金钱、地位、美女、事业、理想等。对很多人来讲,女人的位
置还要重于金钱和地位——追求金钱与地位其目的也是为了追求女人。婚姻问题是一个
几乎关系每一个人和家庭的异常重大的问题。下面将证明计划生育引起大多数男性择偶
困难,并导致绝大多数国民痛苦。实际上,男女性别比失调引起的痛苦大于经济,且无
法解决,也是最早令绝大多数国民痛苦的寄生后遗症。然而大多数国民硬是说我怎么没
感觉到?问题是愚民们感觉到什么了吗?中国人竞争意识太强了。很多人(尤其是精英
)对计划生育引起男女择偶造成巨大困难问题不屑一顾。有人找不到老婆,旁人往往讥
之为“没能力”。这种说法既无人性,也无道理。如果将一个人腿弄残疾,再让他参加
百米跑,跑不快就说他没能力岂不是很可笑?因此“剩女、剩男问题出现的量化简析”
一文具有极端重要的现实意义。在本书“对汉奸的忠告”一节中还会看到它的作用。
男人找老婆困难的主要原因是计划生育引起男多女少(女性相比男性被多屠杀了4000万
)和总人口减少,其次是崇洋媚外和金钱至上,而引起崇洋媚外和金钱至上的部分原因
又得归咎于计划生育。... 阅读全帖
m***e
发帖数: 428
40
《和平与发展》 作者:李忠林
印度是一个正在崛起的大国,这已成为国际社会的共识,也是一个不争的事实。学术
界普遍认 为,优越的地缘政治条件、丰富的自然资源、悠久的历史文明、众多的人口资
源以及强大的军事实力必将促使印度成为世界大国。美国学者斯蒂芬•科恩 (
Stephen P. Cohen)在《印度:崛起中的大国》(India:Emerging Power)一书中从经济的
快速发展、各种新兴力量的兴起、政局的相对稳定以及印度的大国抱负等方面指出印度
正在崛起。[1]中国学者也普遍赞同。不过印 度崛起的制约因素仍然不容忽视,如过多
人口数量、槽糕的基础设施、传统文化中的落后面、不稳的地区安全 形势、严重的族
群和宗教矛盾等。并且这种约束将是 长期性的,不仅影响印度政治和社会的稳定及经济
发展,还影响了与南亚诸国的关系,这些都将增加印度崛起道路上的难度。
虽然关于印度崛起 的研究是过去几年的重点,但是这一研究并没有因为近期印度发
展形势的不容乐观而停止。在近期的研究成果中,就有学者继续从地缘优势形成的区域
支配地位、继 承殖民遗产带来的机缘好处、在大国博弈中获取的“政治红利”、... 阅读全帖
g**1
发帖数: 10330
41
只因写了一段爬虫,公司200多人被抓!
“一个程序员写了个爬虫程序,整个公司200多人被端了。”
“不可能吧!”
刚从朋友听到这个消息的时候,我有点不太相信,做为一名程序员来讲,谁还没有写过
几段爬虫呢?只因写爬虫程序就被端有点夸张了吧。
朋友说,消息很确认并且已经进入等待审判阶段了。
01.对消息进一步确认
朋友认识几个律师朋友,和他们有一些业务来往,得知他们想尝试把业务扩展到程序员
这个群体。那段时间我刚好离职也有时间,在朋友的安排下一起聊聊看看有没有合作的
机会。
他们为什么想扩展人群到程序员这个行业呢?其实就是因为他们代理了这名程序员的官
司,才发现很多程序员完全不懂法,直接说是法盲一点都不过分。
刚好我也很好奇程序员因爬虫被抓这个案子,看看到底是怎么回事,就和两名律师以及
朋友坐到一起,深入交流后才知道整个事件的来龙去脉。
这名程序员在被警察逮捕后,警察审问期间一直不承认自己触犯了法律,并且也完全没
有意识到自己犯法了。进去之后总以为警察搞错了,过几天就会把自己放出来,结果也
错过了取保候审的机会。
律师说,这名程序员的妈妈当时在他毕业的时候,就因程序员这个行业太辛苦不同意他... 阅读全帖
d****o
发帖数: 1055
42
来自主题: JobHunting版 - 详解知名网站的技术发展历程(zz)
对于大家复习design problem有帮助
互联网已经发展多年,其中不乏脱颖而出者,这些网站多数都已存在了接近10年或10
年以上,在如此长时间的发展过程中,除了业务上面临的挑战,在技术上也面临了很多
的挑战。我挑选了一些Alexa排名较前的网站(排名截止到2012年4月21 日),看看它们
在技术上是如何应对业务发展过程中的挑战的。
Google 目前Alexa排名第1。它诞生于1997年,当时是一个研究性项目,每个月
build一次索引,build出来的索引通过sharding(shard by doc)的方式分散到多台服务
器(Index Server)上,具体的网页数据同样通过sharding的方式分散到多台服务器(Doc
Server)上,当用户提交请求时,通过前端的一台服务器将请求提交给Index Server获
得打了分的倒排索引,然后从Doc Server提取具体的网页信息(例如网页标题、搜索关
键词匹配的片段信息等),最终展现给用户。
随着索引的网页增加,这个结构可通过增加Index Server以及Doc Server来存储索
引以及网页的数据,但仍然会面临其他... 阅读全帖
d********w
发帖数: 363
43
来自主题: JobHunting版 - 大数据创业公司篇
这里面创业公司太多了,包含BI工具,数据存储和挖掘,应用等,我就简单说一些我感
兴趣的,其他的可以参考。
Palantir:超过百亿美金估值,已经是超级独角兽,就单独列出来。Peter Thiel创办
大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,
并发现趋势、 关系和异常,包括预测分析。
##############
Database
MemSQL: 号称最快的内存数据库。
GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。
MongoDB: 分布式文件存储的数据库
DataStax:主力开发Cassandra。
Hadoop
Altiscale: 提供的Hadoop作为一种服务(HAAS)
Qubole:Hadoop服务提供商,Pinterest也是它的客户
Splice Machine: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP
和OLAP 应用进行实时优化处理
机器学习
Paxata:应用机器学习技术处理大数据难题
0xdata:H2O 的算法是面向业务流程——欺诈或趋势预测
Everstrin... 阅读全帖
b********w
发帖数: 334
44
直接面向个人
Tech Details:
- FDA approved Saliva collection kit.
- Agilent SureSelect V5 50MB chip
- 75x on target coverage (after mapping, filtering, and duplicate removal,
130-140x raw throughput)
- 99% Coverage > 1x
- 90% Coverage > 20x
- CLIA certified Illumina sequencing.
Deliverable
- Ownership of your genome
- VCF file (Beta 期间你要原始数据 BAM,我们也可以提供。)
- CLINVAR, CGD summary about your variants
- Traits
- Beta 期间你要原始数据,我们也可以提供。
Public exposure
Genomeweb:
https://www.genomeweb.com/molecular-diagnost... 阅读全帖
c***s
发帖数: 70028
45
11月1日,中国展开第六次全国人口普查。人口普查无疑是一个国家最基础的统计,但这些数据是如何被使用的却不总是清晰的。今年年初,另一个人口大国、同时也是“数据大国”的美国也完成了人口普查。此时不妨看看,美国是如何运用人口普查所得数据的。
10分钟简单完成10道题,普查局连收集姓名也须解释
美国人口普查始于1790年,依美国宪法规定每10年进行一次。今年3月,美国开始第23次人口普查,对象是居住在美国的人,不论是否美国公民,合法或非法。美国政府通过人口,统计普查年份全美各州、县、市、镇、乡和地方区域的人口数据。但数据越来越精确的同时,问题设置却越来越简化。
过去的美国人口普查问卷上,包括家庭收入、教育程度等各种调查居民经济状况的问题,现在就只简化为10个问题,包括每一名家庭成员(表格上只设置了最多6名成员)的姓名、性别、年龄、电话号码、出生日期、与户主关系、种族,住所是自有还是租赁等基本情况。商务部属下的人口普查局网站,对为何收集每一项信息(比如最基础的姓名)都须作出解释,例如,收集居民姓名是为了避免重复和混淆性别,以及方便(且仅供)居民个人查阅和调用统计结果。
74%普查以邮寄问卷完成,... 阅读全帖
c***s
发帖数: 70028
46
■美国大使馆的监测数据中PM2.5是重要指标之一
■北京市环保局的监测数据中尚不包含PM2.5
10月份以来,浓雾接连袭京,北京的空气能见度变差,空气质量也受到影响。美国驻华大使馆发布的数据更是掀起层层波澜,引起争议,有人甚至怀疑北京的空气质量自奥运会之后下降了。
近日,中科院大气物理研究所王跃思研究员、美国康州环保局前任空气质量主管克瑞斯·杰姆和美国加州空气资源委员会前主席凯瑟琳·维斯普恩就市民关注的热点问题,接受了记者的采访。
美国大使馆与北京市环保局数据该信哪个?
一问
■中科院研究员王跃思:
我们的数据与市环保局一致
公众时常有这样的困惑,当美国大使馆标注的PM2.5是“不健康”,甚至是“有害”时,北京的空气质量却是“良”,究竟应该相信哪个数据?
王跃思:作为第三方监测机构,中科院大气物理研究所自2003年以来一直在从事独立的空气质量监测,空气质量监测结果与北京市环保局监测的数据基本一致。
中科院大气物理研究所的监测范围覆盖京津冀等华北五省市,监测污染物主要包括PM10、PM2.5、臭氧、氮氧化物、二氧化硫等。在这个区域我们共有 31个监测子站,其中11个在北京。从2003年... 阅读全帖
o***s
发帖数: 42149
47
@微软数据视界:创业如同追妹子!不信?成功的创业者都善用数据追女神!你可能不屑一顾,觉得追女生是一件不需要科学的东西,下面小编用一组数据来告诉你,如果能够发现这些数据的奥秘,对于你是否能够逆袭摆脱单身是很关键的!并且,这跟创业其实是一回事……
记者追访:追女生靠的是什么?诚意!勇气!近日,一条建议用数据分析追女神的微博走红,该微博称,追女孩也要讲究科学方法,掌握相关数据十分关键:从第一次与妹子约会到最终确定关系平均需要六次,周三约妹子成功率最高;除掌握身高、体重、年龄等基本数据外,生理周期、闺蜜人数、购物频率等都相当重要;此外,还要用到微博、微信、QQ各种社交工具……
周三约妹子最易成功
“从第一次与妹子约会到最终确定关系,需要六次;星期三约妹子的成功率最高;妹子剪头发意味情感生活有变动……”对此,不少女网友表示,自己失恋或者在迎接新恋情的时候,的确会去换发型。
该微博还称,女孩身高、体重、生理周期、闺蜜人数、购物频率等,都属于“基础”数据;女孩更新社交网络的频率、一般几点睡觉、每天郁闷频率,整理这些数据,就能对她做出常识性判断;而最难以量化的数据就是,女孩的价值观取向、食物偏好、性格... 阅读全帖
r*******3
发帖数: 10886
48
这帮人是要搞的以后海龟wsn更难混啊。。。
原标题 [我国宏观经济数据被外媒提前公布案情披露 8人获刑]
我国宏观经济数据竟被境外媒体提前公布危害我经济安全案件侦办机关首次披露案情
CPI数据泄密案8人获刑
以路透社为代表的境外媒体及相关机构对我国经济数据的预测准确度相当之高。
据媒体报道,2008年至2011年,路透社累计7次精准地“猜”对了我国的月度CPI数
据。中国的核心经济数据屡屡提前“走光”,统计局权威发布的公信力受到极大质疑。
经过调查,“内部人员涉嫌泄密”浮出水面,相关部门随后对数据泄密事件展开侦
查。
目前已有8人因涉案获得法院判决。其中,孙振、伍超明等被判处有期徒刑5年至6
年不等的刑罚。
今天上午,承办该案件的西城检察院披露了案件侦破过程。
调查 统计局官员及证券公司职员涉嫌泄密
2011年2月28日,北京市西城检察院反渎职侵权局按照国家保密局、最高人民检察
院、北京市人民检察院的指示,成立2·28专案组。国家统计局的孙振以及上海某证券
公司工作的郑飞进入专案组视线。
孙振作为国家机关工作人员,比较容易控制。对于郑飞的情况,专案组却知之甚少
,只知道他在上海某证券公... 阅读全帖
g**1
发帖数: 10330
49
商务部无条件批准马云收购恒生集团
公司报道财新网[微博] 刘彩萍2014-09-20 07:39我要分享 444
[摘要]商务部先定为“简易案件”来处理,最终,马云收购恒生电子的交易获商务部“
无条件批准通过”,理由是该案通过不会在相关行业限制或消除竞争
【财新网(微博)】(记者 刘彩萍)阿里巴巴集团刚刚在美国轰轰烈烈地完成上市
,该公司董事长马云收购杭州恒生电子集团有限公司(下称恒生集团)一案也获得了商
务部的审批通过。经过商务部反垄断局审查近4个月的审查,商务部已“无条件批准”
此案。这是财新记者从权威渠道独家获悉的结果。
“反垄断局在对并购案进行经营者集中审查时,最优先考量的是,两家公司的合并
是否会减少或消除竞争。”接近商务部人士告诉财新记者,恒生电子的市场份额很高已
是既定事实,在该笔并购之前就已经存在,浙江融信与恒生电子没有业务上的重叠,两
家公司合并后也不会消除竞争,商务部没有理由不予以批准。
该项交易获批,意味着马云将成为恒生集团的实际控制人,并间接控股上市公司恒
生电子(600570.SH)。恒生集团持有恒生电子20.62%的股份。据公开资料显示,恒生
电子主要向银行... 阅读全帖
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)