由买买提看人间百态

topics

全部话题 - 话题: 提供数据
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
g**1
发帖数: 10330
1
密件披露谷歌等九家美国互联网公司为美情报机构提供数据
美国 公司 2013年06月07日 08:19    文 / 若离
华盛顿邮报得到的密件显示,从2007年起,美国国安局(NSA)和FBI通过代号PRISM的
绝密项目直接进入九大美国互联网公司的中央服务器,使用其中的音频、视频、图片、
电邮、文件和连接日志分析追踪个人动向和联络方式。
为PRISM项目提供信息的公司包括:微软、谷歌、雅虎、Facebook、PalTalk、YouTube
、Skype、AOL和苹果。
值得一提的是,虽然PalTalk与其他八家公司相比规模小得多,但它在阿拉伯之春和叙
利亚内战期间发挥着重要作用,有很大流量。
密件称,云存储服务供应商Dropbox“很快”会加入。
华盛顿邮报获悉,只有少数国会议员知道PRISM,当然,他们都发誓对外封口。
换句话说,美国总统奥巴马可能都不清楚这个项目的存在。
华盛顿邮报称,通常,像雅虎和AOL这样的公司必须接受司法部长和国家安全机构主管
的“指示”,让FBI的截获数据技术部门(DITU)可以任意进入自己的服务器。遵从指
示的公司可以豁免法律起诉。
2008年,美国国会... 阅读全帖
Z****o
发帖数: 999
2
发信人: ZoZoZo (石更木奉), 信区: StartUp
标 题: 为国内公司一个疾病分子检测试剂盒提供数据收费多少比较合适?
发信站: BBS 未名空间站 (Wed Jun 17 12:50:42 2015, 美东)
国内公司委托我提供一个疾病的分子检测试剂盒的相关数据,我这边已经花了一个多月
时间,查文献和资料,最后敲定20多个基因,每个基因若干个(10-20)SNP位点,一共
200多个位点,整理成一个文档。
不知道这样的技术分析,找他们收费多少比较合适啊?
10万美元? 5万美元? 还是1万美元?
大家有可以参考的价格吗,谢谢!
w*********g
发帖数: 30882
3
世界主要国家的大数据战略和行动
2015年07月03日 17:30:22 来源: 中国信息安全
分享到:
3
【打印】 【纠错】
美国
将大数据视为强化美国竞争力的关键因素之一,把大数据研究和生产计划提高到国
家战略层面,并大力发展相关信息网络安全项目。
2009年,美国政府推出Data.gov,这是为了增加政府资料透明度而设立的一系列网
站。
该网站依照原始、地理数据和数据工具三个门类,截至2012年11月,Data.gov共开
放出了超过40万项原始数据和地理数据,涵盖大约50个细分门类。为方便公众使用和分
析,Data.gov平台还加入了数据的分级评定、高级搜索、用户交流以及和社交网站互动
等新功能,汇集了1264个应用程序和软件工具、103个手机应用插件。通过开放API接口
,Data.gov使得私人领域的开发者能够利用那些政府采集但未经梳理的各类信息,开发
应用来提供公共服务或者进行盈利。但随着近年美国政府陷入财政困局,白宫于2011年
4月宣布这些网站将终止营运,但会将它们开源化,以供各国的开发者使用或者根据需
要修改。
2012年3月29日,美国白宫科技政策办公室发布... 阅读全帖
u***r
发帖数: 4825
4
https://wemp.app/posts/3b1804b7-6d6f-4705-bbfc-10dcd9995f7c
近日,新型冠状病毒引发的武汉肺炎疫情,受到举国上下极大关注。有人提议,大数据
可以有效分析武汉人的行踪,为疫情监控提供帮助。笔者认为,在新科技越来越发达的
时代,我们完全可以用好这个工具。
近日,新型冠状病毒引发的武汉肺炎疫情,受到举国上下极大关注。有人提议,大数据
可以有效分析武汉人的行踪,为疫情监控提供帮助。笔者认为,在新科技越来越发达的
时代,我们完全可以用好这个工具。
例如,从某软件统计的航空信息可以看出,自2019年底疫情初起到今年1月20日疫情升
级,从武汉天河机场到北京的人数最多,到广州的其次,而且有具体人数。再如有数据
公司通过大数据,找出了很多11月去过武汉海鲜市场的人,画出了这些人后来去哪里的
分布图。也有人认为,通过移动支付的交易大数据,也可挖掘出有价值的信息。
“用大数据帮助疫情防治”的想法能够产生,说明了中国社会的进步。以前要大规模跟
踪人群的流动是不可想象的,它需耗费很多资源。如今随着智能手机的普及,各类APP
日益渗透深入到日常生活中。人... 阅读全帖
k*******l
发帖数: 698
5
来自主题: Military版 - 一些国际政治经济趣味数据
1、世界上实行免费医疗的国家完全免费:瑞典、挪威、文莱、卡塔尔、古巴、老挝基
本免费:芬兰、新西兰、斯威士兰、阿联酋、科威特、丹麦
曾经免费后取消免费:冰岛、阿根廷、希腊、菲律宾、斐济、瑙鲁、捷克、斯洛伐克、
匈牙利、罗马尼亚、保加利亚、波兰、德国、阿尔巴尼亚、蒙古、波斯尼亚和黑塞哥维
纳、克罗地压、马其顿、黑山、塞尔维亚、科索沃、斯洛文尼亚、乌克兰、白俄罗斯、
俄罗斯、乌兹别克斯坦、哈萨克斯坦、立陶宛、爱沙利亚、拉脱维亚、摩尔多瓦、亚美
尼亚、土库曼斯坦、塔吉克斯坦、阿塞拜疆、格鲁吉亚、吉尔吉斯斯坦、越南
注:
朝鲜——为“政治身份区隔福利制”,很难进行是否免费的划分
新西兰、卡特尔——世界上仅有的两个对境内外籍人免费医疗的国家
2、世界上国内武装冲突最频繁的国家(1990年代——2013年)
年均国内武装冲突超过1000次:苏丹、南苏丹、布隆迪、阿富汗、马里
年均国内武装冲突500——1000次:贝宁、莱索托、科索沃、波黑、多哥
年均国内武装冲突100——500次:伊拉克、塞尔维亚、巴基斯坦、中非共和国、乌干达
、卢旺达、海地、印度、哥伦比亚、尼泊尔、俄罗斯、叙利亚、伊拉克、阿塞拜... 阅读全帖
b*****d
发帖数: 61690
6
美国安全局强索网民信息
谷歌、微软、雅虎等被迫提供保密数据
美国一些大型网络公司3日向政府律师和公众披露了更多新数据。这些数据显示,
在美国国家安全局压力下,他们被迫向国安局提供大批量本该保密的用户数据。被迫向
国安局公开用户数据的大型网路企业包括谷歌、微软、雅虎、社交网站“脸谱”、职业
社交网站LinkedIn和简易博客网站Tumblr。
被迫
新公开的数据显示,过去几年,国安局常以反恐调查和情报相关调查为由,向这些
互联网热门网站索要用户信息。
例如,谷歌和微软在2012年至2013年间的每6个月,被迫向国安局提供了上万名用
户数据;雅虎在同一时期被要走大约4万个用户的资料。自“棱镜”项目曝光后,这些
企业曾有限度地披露了一些被迫提供数据的情况。上星期,奥巴马政府批准一项新规定
,准许这些企业更为宽松地向公众披露相关信息。
美联社4日说,从这些企业公开的图表、数据和陈述中可以看出,这些网络公司一
方面想通过这种方式向政府提出抗议,展现自身的隐私保护意识,另一方面希望向用户
传递信息,表明被泄露的用户信息有限,并非涉及所有用户。
遭黑
除被迫提供数据外,这些企业还发现,政府情报部门通... 阅读全帖
d********w
发帖数: 363
7
来自主题: JobHunting版 - 大数据创业公司篇
这里面创业公司太多了,包含BI工具,数据存储和挖掘,应用等,我就简单说一些我感
兴趣的,其他的可以参考。
Palantir:超过百亿美金估值,已经是超级独角兽,就单独列出来。Peter Thiel创办
大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,
并发现趋势、 关系和异常,包括预测分析。
##############
Database
MemSQL: 号称最快的内存数据库。
GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。
MongoDB: 分布式文件存储的数据库
DataStax:主力开发Cassandra。
Hadoop
Altiscale: 提供的Hadoop作为一种服务(HAAS)
Qubole:Hadoop服务提供商,Pinterest也是它的客户
Splice Machine: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP
和OLAP 应用进行实时优化处理
机器学习
Paxata:应用机器学习技术处理大数据难题
0xdata:H2O 的算法是面向业务流程——欺诈或趋势预测
Everstrin... 阅读全帖
d*****r
发帖数: 1635
8
你不要听搞生物的瞎扯,对你没有任何参考价值。
我是搞社科的,手上有不少数据,按我的经验,可以给你一些参考意见。
1. 自己到企业调查的数据:被调查企业有100%的决定权。我跑过20多家企业做case
study,大多数企业都会同我签一个协议,规定哪些原始数据可以直接公表,哪些数据
经过处理后可以公布。但通常都不能提供给第3者。也就是说,不能给你,也不能给杂
志的Editor。
2. 自己做问卷调查得到的数据:自己有100%的决定权。如果你提出要我做你的co-
author,使用数据,我也要考虑,值得不值得。即便值得,我也要你同我签协议,
(1)你不能提供数据给第3者,(2)使用期限。期限过后,不得再使用,必须把数据销毁。
3. 到做调查的商业机构买来的数据. 例如,我在data bank花1万美金买来的数据。我
有100%的使用权,但我没有著作权。你可以同我作co-author,让你暂时使用。但如果你自己单独要用,自己花钱买去。否则,我提供给你,我在犯罪。
4. 一些非盈利的政府机构的调查数据。通常我向该机构申请,该机构批准后,会把数
据无偿给我。但通常会同我签一个协议:(1)申请使用... 阅读全帖
b******3
发帖数: 4385
9
转自环球网
于2014年3月10日启动报名的首届阿里巴巴大数据竞赛开赛一个月以来,报名队伍数突
破6400支,已经成为目前全球最大的算法类竞赛之一。截止4月10日,阿里巴巴大数据
竞赛总参赛人数近1.5万人。其中港澳台参赛队伍超过120支,海外队伍超过80支。
此前,从1997年开始已举办了15届的KDD CUP一直以来是世界范围内最大规模的数
据竞赛,该竞赛依附于美国计算机协会数据挖掘及知识发现专委会主办的ACM SIGKDD国
际会议(简称KDD)。作为数据挖掘研究领域的顶级年会,2012年的KDD CUP数据竞赛曾经
吸引了国内队伍参加,但全球范围内参加的队伍数不超过1000支。
据悉,阿里巴巴大数据竞赛是由阿里巴巴集团主办,在阿里巴巴大数据科研平台—
—“天池”上开展的,基于天猫真实推荐业务场景与海量真实用户的访问数据的推荐算
法大赛。整个竞赛过程持续九个月,将于十一月中旬结束。参赛选手不仅可以通过大赛
接触到真实的天猫用户行为数据,还有机会被邀请到天猫,与天猫推荐算法团队的工程
师们一起设计双11的个性化推荐产品。
阿里巴巴天池项目负责人王一婷对面向学术界免费开放天池平台的目... 阅读全帖

发帖数: 1
10
据中国科学报11月21日消息,本月13日,伊朗、伊拉克边境地区附近发生7.8级左右地
震,为协助两国进行抗震救灾工作,国家综合地球观测共享平台于地震发生当日,紧急
启动中国综合地球观测卫星遥感数据共享机制,面向共享平台各分中心和我国主要卫星
数据服务单位发布紧急通知,动员和征集重点震区的遥感卫星数据,获取震区的高分辨
率图像,并进行灾情分析处理。这是国际上首个针对此次地震的数据应急活动。
伊拉克地震高分三号雷达遥感解译图(数据来源:中科院遥感地球所 邵云团队)
在科技部指导下,这项工作由中科院遥感地球所卫星数据技术部具体组织开展,目前已
收集到国家卫星气象中心提供的风云三号系列卫星、中国资源卫星应用中心的高分二号
、二十一世纪空间技术应用公司的北京二号和长光卫星技术有限公司的吉林一号系列卫
星、北京航天世景信息技术有限公司的高景卫星、国家测绘局卫星测绘应用中心资源三
号等10颗卫星、570景、256GB地震前/后遥感数据。后续陆续还有更多国产和国际卫星
数据的更新,以及灾情信息结果的汇集和发布。
11月16日,中国科学院遥感与数字地球研究所组织多家科研团队利用共享平台提供的震
后数据进... 阅读全帖
c**********n
发帖数: 227
11
来自主题: Quant版 - 关于金融数据的处理 (转载)
【 以下文字转载自 Working 讨论区 】
发信人: countrywoman (理想之村村长), 信区: Working
标 题: 关于金融数据的处理
发信站: BBS 未名空间站 (Sun Sep 28 15:13:13 2008)
做金融分析需要参阅大量金融数据分析财务报表,我是股票基金方面的分析员,每天都
要处理大量数据,数据来源主要是datastream and Bloomberg,两个公司后者数据相对
比较干净但是数据不全,而前者提供的数据发现不少错误。跟其他单位同行交流过发现
数据的可靠性非常重要而提供数据的公司问题不少。 我当时跟单位老同事提出过一个
设想,数据经手的途径越复杂越多数据被污染的机会越多。 如果政府出资研究一套软
件系统,政府可以规定所有上市公司通过此系统制作财务报表,将数据直接提供到由财
政部监管的部门,系统软件自动生成有着统一数据格式的文件,文件兼有pdf的稳定性
和excel数据灵活操作性。对调取使用数据的企业收费。这样可以减免数据污染途径提
高数据的可靠性,对于研究和金融分析很有帮助。
同事觉得提议不错但是可执行性不高。我个人觉得这个建议应该
s****n
发帖数: 8912
12
来自主题: Military版 - 5月宏观数据疑似早泄
核心提示:国家统计局计划于6月14日公布5月份宏观经济数据。和以往一样,在公布前
夕,网络上就出现了疑似“走光”的核心数据,各家金融机构争相预测。
在国家统计局将按计划于6月14日公布5月份中国一系列宏观经济数据前,和以往一样,
5月CPI等核心数据这之前已经在网络上频频疑似提前“走光”。
6月8日,路透社再次抢先发布我国经济数据,预测中国5月份CPI较上年同期上涨5.4%,
将追平3月份创下的32个月高位,与此同时,网络上各位“经济学家”和各家投资机构
乃至网民对于最新宏观经济数据的预测也热火朝天。
与此类似,彭博也在其终端上发布称,经济学家对宏观数据的预测值显示,5月份的中
国CPI同比涨幅为5.5%。而根据“中国网事”记者掌握的数据,另有四家国内外证券机
构对5月份的中国CPI同比涨幅预测也为5.5%,高达三家机构对5月PPI的预测为同比增长
6.4%。
微博上,证券市场资深分析师黄硕写道:“明日上午10时将公布的5月CPI似乎已经没有
太大悬念目前市场对于该数据的一致预期是5.5%,高于4月份的5.3%。”
事实上,这已经不是第一次市场“竞猜”宏观经济数据了,而以路透社为代表的... 阅读全帖
M*V
发帖数: 3205
13
来自主题: WorldNews版 - 5月宏观数据疑似早泄zz
发信人: sautin (老将萨乌丁), 信区: Military
标 题: 5月宏观数据疑似早泄
发信站: BBS 未名空间站 (Tue Jun 21 01:42:26 2011, 美东)
核心提示:国家统计局计划于6月14日公布5月份宏观经济数据。和以往一样,在公布前
夕,网络上就出现了疑似“走光”的核心数据,各家金融机构争相预测。
在国家统计局将按计划于6月14日公布5月份中国一系列宏观经济数据前,和以往一样,
5月CPI等核心数据这之前已经在网络上频频疑似提前“走光”。
6月8日,路透社再次抢先发布我国经济数据,预测中国5月份CPI较上年同期上涨5.4%,
将追平3月份创下的32个月高位,与此同时,网络上各位“经济学家”和各家投资机构
乃至网民对于最新宏观经济数据的预测也热火朝天。
与此类似,彭博也在其终端上发布称,经济学家对宏观数据的预测值显示,5月份的中
国CPI同比涨幅为5.5%。而根据“中国网事”记者掌握的数据,另有四家国内外证券机
构对5月份的中国CPI同比涨幅预测也为5.5%,高达三家机构对5月PPI的预测为同比增长
6.4%。
微博上,证券市场资深分析师黄硕写道:... 阅读全帖
g*k
发帖数: 1797
14
不需要求爷爷告奶奶的,需要读一些相关文章,研究他们的数据从哪里搞来的。然后到
提供数据的地方去申请买数据。CDC提供一些免费的数据,你可以到他们网站找找,我
以前用过BRFSS,不过是和流感没关系的疾病。
http://www.cdc.gov/Brfss/
大部分的数据处理中心都提供类似的网站,让你搜索他们拥有的数据,变量名等等,还
有如何申请购买数据。
G*******h
发帖数: 4091
15
还嘴硬?
你的意思是民调公司不懂你所谓的奇怪的选举制度所以才搞了这么多没用的你所谓的普
选数据民调?还是希拉里团队和主流媒体傻不楞登的不会解读民调公司提供的数据当成
是奇怪的选举制度的民调了?又或者是民调公司提供数据的时候没有注明是普选数据或
者非选举人制度数据?
你这么说,是不是想说民调公司、主流媒体、希拉里团队都是白痴,混了这么多年连总
统大选的规则都搞不懂,搞一堆没用的数据还奉之若宝以为自己赢定了?
话说,你现在又说奇怪的选举制度,是不是输了之后又赖规则不行?这又是sour
loser干的行径。
其实呢,你力撑的民调公司选前都有各个州的民调数据,去对比一下这些数据和实际的
选举数据就知道了。尤其摇摆州的前后数据,这些民调公司的的预测没一个准的。
再说,除了你们之外,有哪个民调公司公开说自己的民调预测的是普选票数没有?你不
妨帮我找一个出来?我想他们再不要脸也不敢这么说来打自己耳光。

:“你们的意思是民调公司都不懂美国大选是选举人制度,所以搞些普选数据的民调来
误导希拉里团队吗?”
c****x
发帖数: 6601
16
密歇根大学关闭中国数据研究中心
安娜堡密西根大学日前以"成本效益欠佳"为由,突然关闭Chinese Data Center。原中
国中心主任鲍曙明5日接受本报电话访问时说,他在9月17日接到密大要关闭中国信息中
心的通知,当天网站就已无法使用。
鲍曙明说,中心财务良好且独立,并未仰赖美国或中国政府经费支持,这次几乎无预警
"被通知关闭"令人错愕。
中国信息中心1997年成立,一开始隶属于密西根大学国际学院(International
Institute),2012年成为校际政治与社科研究联盟(ICPSR)的合作伙伴至今。
校方否认与美中关系紧张有关
密大发言人布鲁克惠珍(Kim Broekuizen)5日以电邮向本报说明,关闭中国信息中心是
经过内部审查后的决定,主要因该中心必须进行重大的技术升级,不过校方认为这并非
大学资源最佳利用之处。她还说,这些技术问题与该中心信息源自中国无关。
对于校方说法,鲍曙明表示,直到密大关闭中国信息中心,中心帐户上还有足够资金,
如果需要大规模的技术升级,这些钱相信足以支付;他说,以前没有听过有类似中心因
技术问题,就必须关闭的案例。
此外,校方表示,... 阅读全帖
d*****r
发帖数: 1635
17
作者只要能向Editor保证其数据的真实性,没有任何义务向别人提供数据。
特别是一些企业的数据,本来就同企业签约不能给第3者。这种情况下,就是Editor都
没有权利向作者要数据。但是企业可以开证明给Editor,保证数据的来源是真实的。
一些Journal,例如Interfaces 就是这种方式。

绝了,说不能给我。所以联系美国这边几位用这个数据做研究发表过journal article
的学者。但是目前没有好的结果,所以不知道怎样才是最恰当的问询方式,不知道是应
该通过发表的journal来联络?还是直接联络作者?是否,无论何种杂志,只要是发表
的文章,原作者都有义务向他人提供原始数据?还是,不同的杂志要求不一样?我联系
了几个使用过这个数据的研究人员,但是目前还没有确切的回复the dataset can be
given to me. 所以很着急,不知道应该继续等回复,? 故橇灯渌耍故侵匦卵罢
冶鸬氖荨?: 多谢分享经验信息!

发帖数: 1
18
“你的意思是民调公司不懂你所谓的奇怪的选举制度所以才搞了这么多没用的你所谓的
普选数据民调?还是希拉里团队和主流媒体傻不楞登的不会解读民调公司提供的数据当
成是奇怪的选举制度的民调了?又或者是民调公司提供数据的时候没有注明是普选数据
或者非选举人制度数据?”
--- “没用”?谁说没用?绝大多数的选举,普选民意都可以预测最后结果,谁说没用
?正因为 track record 良好,所以选前所有人都相信了民调公司的普选数据。
算了,我早说过,阴谋论无敌!跟你们说什么都是白搭,所以我也不多嘴了,你就直接
把民调作假的证据摆出来。你的证据在哪里?就连窃听门事件、选票舞弊事件,至少还
有那么点蛛丝马迹,民调作假的证据在哪里?你们口口声声说所有媒体,所有民调公司
都在作假,那么这是一个大规模舞弊,参与的人、知情的人恐怕好几千号,不可能隐瞒
得住的,你去拿个证据出来,电邮、视频都好。
BTW,告诉你什么是 sore loser。sore loser 是那种输了电视艾美奖,然后就指控人
家 it's rigged 的那种人。懂这差别吗?川普面对失败时,他不是要求重新计票,他
不是检讨选举规则,他是一... 阅读全帖
a****e
发帖数: 1662
19
你有什么权利向别人要原始数据?除了法庭警察,其他人都没任何权利。
"作者只要能向Editor保证其数据的真实性,没有任何义务向别人提供数据。"

绝了,说不能给我。所以联系美国这边几位用这个数据做研究发表过journal article
的学者。但是目前没有好的结果,所以不知道怎样才是最恰当的问询方式,不知道是应
该通过发表的journal来联络?还是直接联络作者?是否,无论何种杂志,只要是发表
的文章,原作者都有义务向他人提供原始数据?还是,不同的杂志要求不一样?我联系
了几个使用过这个数据的研究人员,但是目前还没有确切的回复the dataset can be
given to me. 所以很着急,不知道应该继续等回复,: 故橇灯渌耍故侵匦卵
罢冶鸬氖荨
u***r
发帖数: 4825
20
https://news.sina.com.cn/c/2020-02-09/doc-iimxyqvz1545577.shtml
原标题:省委书记提出要求之后,湖北疫情通报首次出现新数据
来源:北京青年报
撰文 | 董鑫
武汉“封城”已满17天,湖北省委书记、湖北省新冠肺炎疫情防控指挥部指挥长蒋
超良提出了一项有明确时间表的新要求:
集中两天时间将全市累积的所有疑似患者检测完毕,释放医护力量和医疗资源,集
中用于确诊患者。
2月8日,蒋超良在武汉市督导疫情防控工作时提出了七项明确要求,这是其中之一。
据湖北省卫健委2月9日的数据,截至2020年2月8日24时,湖北省已有疑似病例
23638人,其中集中隔离12918人,当日排除1128人。
政知见(微信ID:bqzhengzhiju)注意到,这是湖北省第一次公开疑似病例数据。
武汉市有多少疑似病例目前并没有官方发布。
要在两天检测完所有疑似患者,武汉准备好了吗?
核酸试剂够吗?
核酸检测是新冠肺炎的重要诊断标准。
从国家层面看。
1月22日,国家药品监管局组织包括疾控系统、临床机构的专家组成特别专家组,
对提出应急审批申请的新冠肺炎病毒核... 阅读全帖

发帖数: 1
21
【 以下文字转载自 SanFrancisco 讨论区 】
发信人: Kiwi20 (), 信区: SanFrancisco
标 题: 猎头招聘BI分析数据仓储 巴巴旗下物流平台-P7经理,P9总监
发信站: BBS 未名空间站 (Sat Feb 25 19:32:26 2017, 美东)
阿里巴巴齐下物流平台,邀请你加入未来世界级物流业巨无霸。Pre-IPO 机会,期权配
发的最佳时期,稳定的高成长机会。
现招募如下职位:
1. 职位名称:数据仓库专家
招聘人数:2
级别:P7 经理级别
部门:数据运营部
工作地点:杭州市
发布日期:2017-02-09
职能类别:技术类-数据
失效日期:2017-04-16
工作年限:三年以上
学历要求:本科
岗位要求:
1 从事数据仓库领域工作至少2年以上,熟悉数据仓库模型设计方法论,并有实际模型
设计及ETL开发经验
2 掌握大型数据库开发技术,如Oracle、Teradata、DB2、Mysql等等掌握至少其中一种
,灵活运用SQL实现海量数据ETL加工处理
3 熟悉数据仓库领域知识和管理技能,包括但不局限:元数据管理、数据质量、性能调... 阅读全帖

发帖数: 1
22
阿里巴巴齐下物流平台,邀请你加入未来世界级物流业巨无霸。Pre-IPO 机会,期权配
发的最佳时期,稳定的高成长机会。
现招募如下职位:
1. 职位名称:数据仓库专家
招聘人数:2
级别:P7 经理级别
部门:数据运营部
工作地点:杭州市
发布日期:2017-02-09
职能类别:技术类-数据
失效日期:2017-04-16
工作年限:三年以上
学历要求:本科
岗位要求:
1 从事数据仓库领域工作至少2年以上,熟悉数据仓库模型设计方法论,并有实际模型
设计及ETL开发经验
2 掌握大型数据库开发技术,如Oracle、Teradata、DB2、Mysql等等掌握至少其中一种
,灵活运用SQL实现海量数据ETL加工处理
3 熟悉数据仓库领域知识和管理技能,包括但不局限:元数据管理、数据质量、性能调
优等
4 有从事分布式数据存储与计算平台应用开发经验,熟悉Hadoop生态相关技术并有相关
实践经验着优先
5 掌握一门或多门编程语言优先,如Java、Python、Perl等
6 最好熟悉Linux系统及常规shell处理命令
7 良好的语言沟通与表达能力和自我驱动动力
岗位描述:1 参... 阅读全帖
b*****d
发帖数: 61690
23
部分省份在政府工作报告中公布了2013年三公经费数据
削减三公经费 各地答卷是否合格
本报记者 李松涛
最近一段时间,各地相继召开地方两会,三公经费削减情况成为社会关注的焦点。
2012年12月4日,中共中央政治局召开会议,会议一致同意关于改进工作作风、密
切联系群众的八项规定。从这一天起,勤俭节约成为政务活动的基本要求。
如今,距离八项规定的出台已经近14个月,各地都交出了怎样的答卷?
20个省(区、市)拿出数据,会议削减最高达50%
按照八项规定的要求,各级政府要精简会议活动,精简文件简报,规范出访活动,
严格执行住房、车辆配备等有关工作和生活待遇的规定。
八项规定出台后,各地政府都开始从公务接待、公务会议等支出上下功夫。正是从
2012年底开始,之前一直火爆的高档餐饮冷了下来,花卉租售市场冷了下来,高端礼品
市场也冷了下来。
在我国,公务接待费用、公车购置及运行费用、公务人员因公出国(境)费用被称为
三公经费。
中国青年报记者对全国多个省市发布的政府工作报告进行了查阅,结果发现,有些
省市给出了削减三公经费的数据,有些省市尚未公开相关信息。
截至记者发稿时,全国31个省(区、市)... 阅读全帖
N*********L
发帖数: 517
24
大家好!
目前NIU的485递交项目小组需要和一位DHS的官员联系,但是相关内容需要一些数据支
持,希望知情者能提供帮助。具体如下:
大家有没有从2007大潮以后到现在为止,已经提交了140, 但是不能交上485的人数?
我希望有这样一个数据,可以在和该官员交流的时候,让他直观的感受到现在这个
backlog的严重程度。这样他才会有兴趣去关心我们的提前交485的问题。从他的角度,
如果他的议案通过了,也是他的政绩。
我希望找到的数据类似这样的
1。从大潮开始到下一年, 交了140, 但是不能交485的
2。大潮开始到下两年,交了140, 但是不能交485的
3。。。。
这样的对比比较清楚。
谢谢!
New Immigrants United
3500 Woodchase Dr. Apt 1735, Houston, TX 77042
Email: c*****[email protected]
组织网站 http://www.niunational.org => http://niunational.com
Facebook: http://www.facebook.com/page... 阅读全帖
x***1
发帖数: 30
25
来自主题: Seattle版 - 核辐射检测数据. Updated daily.
十分感谢楼主在大家需要的时候提供数据。这里有Washington state的daily数据,楼
主可以休息休息。如果government提供的数据trend和你的reading不一样,还拜托楼主
通知一下。
http://www.doh.wa.gov/Topics/japan/monitor-history.htm
y**********g
发帖数: 2285
26
近日,哈尔滨工业大学“社会网络与数据挖掘”联合实验室与国内社交媒体数据挖掘公
司“宏博知微”合作开展研究,利用研究构建的抑郁倾向识别模型,在新浪微博近亿用
户中识别出了几百名重度抑郁症患者,该研究结果经医学机构确认准确度达到了83%。
相关人士表示,这项研究结果或成为抑郁症临床诊断之外的新兴诊断方法。
该项研究由哈工大“社会网络与数据挖掘”联合实验室与国内社交媒体数据挖掘公司“
宏博知微”共同开展。实验室负责人哈工大博士于霄告诉南都记者,他是在微博上几位
抑郁症患者自杀事件发生后开始关注抑郁症患者这一群体的,“仔细看这些人的微博,
非常触目惊心,负面情绪在每一条都很明显,当时我们就感叹,如果通过数据识别这一
群体,让其亲友能早点干预,也许可以避免悲剧发生。”据公开数据,自杀人群中有
63.5% 患有抑郁症,但仅 9% 在自杀前曾到精神科或心理咨询机构就诊。利用大数据来
识别个体抑郁倾向及自杀倾向,或能及时挽救更多抑郁倾向人群的生命。
该预测模型会扫描微博用户语言中的抑郁相关关键词
如何识别抑郁群体?于霄和同事首先是挑选新浪微博用户中被确认为抑郁症的人群作为
样本,通过计算机强大的计算能... 阅读全帖
t*******a
发帖数: 4055
27
俄罗斯媒体热议中国人口数据造假问题,称中国实际人口并非近15亿。
俄罗斯社交媒体和网络上在近期正热炒着一个有关中国人口的话题:中国人口数据造假
,实际人口可能仅有官方公布的近15亿人口的二分之一,8亿人口;甚至是三分之一,
仅有5亿。
俄罗斯“Pikabu”网站在发表了题目为“中国进行人口数据欺骗”的一篇文章中,引述
了俄罗斯专家维克多·米哈瓦的评论称,对中国的粮食产量和进出口数据的研究,得出
结论令人震惊,中国的人口不可能是官方对外宣布的将近15亿的人口。
还有俄媒体报道说,在把中国城市人口的公开数字加到一起之后,才得出了2.8亿人口
。根据城乡人口对半的惯例,中国实际人口应该在5亿左右。即使中国情况特殊,农村
人口占比例更多,人口也不应该超过8亿。
俄罗斯“OK.ru”网站上也播放了俄网络评论人士的视频称,中国早已认识到,巨大人
口数量的威慑力量相对于枪炮的威力是有过之而无不及。故意夸大本国人口数量是有战
略意义的。
不过,也有俄罗斯专家发表评论称这是无稽之谈。俄罗斯政治军事评论人士康斯坦丁&#
8226;杜威舍夫对该问题评论称:“对于中国故意夸大人口数据的问题,我个人非常不
相信... 阅读全帖
f**r
发帖数: 865
28
er, 我来解释一下吧。
我个人感觉,在教育孩子方面,市面上各种各样的说法很多,但是如果
仔细推敲的话,大多数(实际上在我所接触的范围内,是绝大多数)都
是观点和推理比较多,用来支持的数据有的薄弱,有的干脆没有(个案
不能算)。按照某作家以前说过的一句话,就是养吾浩然之气,然后觉
得自己事事都对,甚至里面我觉得有些质量比较高的书也有这个问题。
比如以前读过一本叫做“unconditional parenting"的书,其实里面提
出的育儿方法我很喜欢,但是很遗憾在提供数据支持上也是含糊其辞。
我之所以把Freaknomics这本书里的结论贴给大家看,有一个重要的原
因是因为作者采取的方法和以上做法是相反的。他对如何教育孩子没有
预先的定见,但是想知道市面上的比较流行的说法哪些有数据支持,哪
些没有。这本书是米国的畅销书,实验的出处都列得相当详尽,如果有
兴趣不妨看看,是很有趣的一本书。这本书支持和反对的人都不少,反
对其中结论的人也有不少是对实验的可靠性发出质疑的,后来作者自己
也对其中几处失误的地方(比如3k党)做了订正。这个作者本人是芝加
哥大学的经济学教授,擅长数据分析。我不是说... 阅读全帖
s********n
发帖数: 26222
29
统妓局都是一帮婊子文人而已,利益集团要啥数据就提供数据。
我要说的是房地产利益集团已经绑架中国经济,统妓局不过是个传声筒。
f********4
发帖数: 2883
30
这篇文章的犯罪数据仅仅是奥克兰的吗?
你要知道其他的,你可以提供数据,案例。
g******4
发帖数: 6339
31

---------------
提供数据连结: (芝加哥击败底特律)
July/June Change (%) June/May Change (%)
https://www.spice-indices.com/idpfiles/spice-assets/resources/public/
documents/240750_cshomeprice-release-0929.pdf
l*****a
发帖数: 38403
32
来自主题: TrustInJesus版 - 关于虐童的数据
越说越跑了,回来回来,先回答爆棚数据,再说什么时侯这个版面变成你们的了?lol
你如果就是要坐在地上骂街不肯提供数据我就不奉陪啦,你继续哈
S*********n
发帖数: 3939
33
那就比较麻烦了
通信录可以在安卓上备份后用邮件发到自己信箱,让后在果机上打开邮件里的附近,就
能直接导入。微信有数据迁移功能,按照微信里的说明可以把所有对话和附件导入到新
的手机。其他的要看每个应用自己是否提供数据迁移功能
短信和通话记录没有直接的办法,可以看看一个叫wondershare的产品好像能导入一部
分,但是是收费的
c******n
发帖数: 16666
34
理想状态下 这2个问题都不该发生
次理想状态下 有足够时间在弄可行性分析和其他啥额外准备工作的时候剔除这些不稳
定因素
实际生活中 根本做不到啊。。
我们这边本来就是这么几个人 提需求和提供数据的人本身自己有时候都没搞清楚要弄
什么。。
我这边又忙得要死 很多项目同步进行,压根没时间细查,一直都是假定他们按照最开
始我们讨论结果 在我给的模板上,把数据准备好了。
但是往往只有到真要开始做了才发现 我日这都是什么鬼东西啊,要么缺东西,要么整
个他们自己理的逻辑都是错的。像我现在手头一个,之前也谈得不错,要做个互动手册
,逻辑略微复杂。我让他们整理个简单的步骤列表,也别上flow chart了,结果证明这
是个错误。。尼玛逻辑混乱不说了,丫整理出60多步都是大步骤,下面细的啥都没写,
真要做出来要有150多步。凭空内容多了,逻辑多了不说,尼玛UX都有大问题了。。
而且一个个都是大忙人,要么wfh要么出去开会,这些细步骤怕是还我要自己推出来

发帖数: 1
35
来自主题: Military版 - 光凭测量数据,AI能发现
取决于谁提供数据
N****s
发帖数: 267
36
来自主题: JobHunting版 - 求助 数据工程 培训班
错失恐惧症(简称“FOMO”)
当前工作不提供数据工程或机器学习经验
l*****k
发帖数: 1059
37
来自主题: Parenting版 - 数据贴
只提供数据。无论点。
Private university: Harvard.
US demographics [1] => Admitted by Harvard in 2010 [2], Affinity
White: 63.7% => 57.1%, 0.89
Black: 12.2% => 11.3%, 0.92
Latino: 16.3% => 10.3%, 0.63
Asian: 4.9% => 18.2%, 3.71
Native: 0.9% => 3.1%, 3.44
Public university: UC.
California demographics [3] => Admitted by UC in 2012 [4], affinity
White: 40.1% => 30.6%, 0.76
Black: 6.2% => 4.2%, 0.67
Latino: 37.6% => 23.3%, 0.62
Asian: 13.0% => 35.4%, 2.72
Native: ... 阅读全帖
H******i
发帖数: 4704
38
因为PERM批了后必须很快file I-140,所以可以用PERM批复人数来代替I-140批复人数,
两者相差应该很小。下图中2007下半年的数字是估计的,其余的(2008-2011)都是劳工部的数据。从2007年七月到现在大致估计应该有一万四千中国人批了I-140,带家属应该有两万人以上无法递交I-485. 印度人有将近十万批了I-140,带家属应该有近二十万,是中国人的十倍。
m******l
发帖数: 1690
39
我用这个 http://itunes.apple.com/us/app/id320920953?mt=8
有什么公共的api或者web service提供数据吗?
m**y
发帖数: 5225
40
来自主题: Soccer版 - 有没有梅西的世界杯数据
烦请梅粉提供数据

★ 发自iPhone App: ChineseWeb 8.2.2
m******l
发帖数: 1690
41
我用这个 http://itunes.apple.com/us/app/id320920953?mt=8
有什么公共的api或者web service提供数据吗?
n**x
发帖数: 606
42
来自主题: Programming版 - 关于古德霸反例的实际测试数据
还是那句话,我谁的臭脚也不捧,只是看到这里没有一个人愿意写几行代码测一下。
我提供数据,大家参考一下。 所以不要再说谁捧谁的臭脚了啊。
问题:
古德霸的反例但凡计算机出身的都看得懂。说白了就是在multi-threading的环境下的
顺序问题。
模拟场景:
- 我的机器12 core,我就听大家的用12个线程。
- 每个线程处理1M请求,total 12M的请求平均分布在12个线程上。
- 1000趟车,每趟20个区段,每个区段1000张票。
算法采用老魏的算法,锁区段,不锁线路。 (所谓锁区段也就是interlocked加减)
测试结果(都是平均值)
- 成功出票2M
- 无票可出10M (看完再下结论)
- 抢票过程如果失败Re-Try一次,结果又大约10个请求Re-try成功。
- 全部请求走完后,把所有失败的请求在处理一边,还是没有票。(这个很重要)
结论:
- 古德霸的a->b的反例属于re-try可以成功的例子。 如果retry不成功,那么基本就没
有满足条件的票了。
后续:
性能问题我的场景还不够真实,等我测完后在update.
e*e
发帖数: 6808
43
来自主题: _PerfectMoms版 - 关于数据版权的问题 (转载)
我同意你的
可以发一封email给老板,cc PI,说per our discussion,我会按你要求提供数据给xx
,请回信confirm。
A***A
发帖数: 251
44
interactivebrokers提供数据用于portfolio management, order management, post-
trade allocation.
版上有人用吗?推荐一个?
https://www.interactivebrokers.com/en/index.php?f=15491
还有谁用他们的API?
y**z
发帖数: 4154
45
来自主题: LosAngeles版 - Target提供一年免费的 ID Protection
为下次泄露提供数据?
h******6
发帖数: 10
46
俺是指提供数据接口,或者指令接口。然后自己可以搞点模型玩玩。
h******6
发帖数: 10
47
俺是指提供数据接口,或者指令接口。然后自己可以搞点模型玩玩。

发帖数: 1
48
不得不承认,目下的中国文化重建工作,正在面临着一种非常复杂微妙的局势。一方面
,国学的复兴热潮正在吸引大量的社会资源与学者的精力,去从事对于中国传统文化的
理解与注释和传播工作;而另一方面,人工智能、大数据等新技术载体的出现,又在全
面地削弱各种传统的文化信息传播模式(特别是对于纸媒)的社会影响力,进而通过对
于“娱乐至上”理念的扩散来抵消严肃文化的传播学效应。耐人寻味的是,国内从事儒
家政治哲学研究的学者,大多倾向于将自己的理论谈话伙伴,定位为同样属于学者意识
形态的自由主义或政治保守主义,却很少顾及信息技术载体下的大众意识形态样态产生
的动力学机制。在笔者看来,这种过于“不食人间烟火”的态度,或许既会削弱儒家在
新技术条件下的说服力与传播学效力,亦会加高在不同专业群之间业已存在的信息壁垒
。而本文的目的之一,也便是本着“消除跨专业对话壁垒”的学术初心,向读者展示激
活传统文化资源应对新技术时代的可能性,由此甚至为一种具有“数码化的儒家”(
digitalized Confucianism)色彩的新技术路线的发育,提供思想层面上的预备性讨论。
然而,使得本文的讨论得以展开的“元语言框... 阅读全帖
s********y
发帖数: 547
49
3月13日,关于马航失联班机事件的消息,对略通航空的人来说,可说是大起大落。打
包上传,但只传送几组规定的数据。 罗尔斯罗伊斯公司承认,他们在这次航程中要求
MH370 自动提供四组数据,第一组是地面状况,第二组是爬升过程中,第三组是平飞中
设置一个点,第四组是降落时提供的。链接 在本次航行中,他们收到了前两组数据,
但第三,第四组没有收到。这和马来西亚航空的说法一致。一点零七收到数据后,联系
中断,如果第三组数据发出的时间设定在即将着陆的时刻,距离最后信号发出时间可能
相差几个小时,美方与马方的描述也就因此可以吻合上了。 从今天凌晨CNN最新的消息
来看,双方的发言更能够从逻辑角度对应起来了。原来,罗尔斯罗伊斯公司和波音确实
没有收到过新的数据。但是,那个三十分钟一次的发送虽然马航没有购买,然而飞机还
会自动每三十分钟向卫星发送一次连接信号!当然,这个信号会被卫星拒绝,但它毕竟
还是发送了。现在看来问题仅仅在于飞机曾向卫星作过几次连接尝试。 如果这个消息
属实,在失去联系后,飞机的确有极大可能在继续航行,至少没有粉身碎骨,否则发动
机的自动连接请求是发送不出去的。 这也使飞机的行踪似... 阅读全帖
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)