e****s 发帖数: 117 | 1 比如建个信用评分模型,训练数据不需要很大,R应该能处理,模型建完以后,我要把
模型应用到1000万个客户,评分结果放到数据仓库里。R的模型能不能导出,同
TERADATA,DB2,ORACLE等的接口如何?如何直接做in database mining? |
|
x****o 发帖数: 142 | 2 讨论下, 这个算说的靠谱吗?
----------------------------------------------
(Big)Data Engineer(更偏计算机应用)是一个最近比较流行的职位, 其有部分类
似于但又不完全类同于Data Scientist (更偏统计模型)也不同于以往BI Engineer/
developer。
一般市场对Data Engineer的要求是,
1, Good work experience in using SQL and databases in a business
environment.
熟知数据库技术
2, Strong experience in Data Warehouse and Business Intelligence
application development
深刻理解数据仓库/商务智能应用开发
3, Experience with scripting languages, i.e. Perl, Python etc. preferred
掌握一门语言, 一般推荐学习Python
4, Evaluate and i... 阅读全帖 |
|
c***s 发帖数: 70028 | 3 微博截图
1月28日下午,网友“淘薛奎”发微博称:年初五携妻子到张家界旅游,到大庸路如意东北酒家吃饭,店家服务态度极差,稍提要求,便恶语相向,甚至追打到店外,导致有孕在身的妻子面临流产,打了三次110后,警方才出警。人命关天,当班民警态度不明朗,迟迟没有处理意见。目前,妻子正在医院做保胎抢救。
微博发出后,引起了网友的广泛关注。
截至2月1日晚8点,该条微博已被转发6626次。
网友“老马不惑”说,三亚还没完,又出来个张家界,这是中国旅游的通病,把游客当猪宰。
网友“坚持不懈”说,公民的整体素质、服务行业的服务水平,政府的处理事件能力都需要努力啊。
网友爆料:妻子在张家界被打面临流产
记者了解到,网友“淘薛奎”姓杨,在杭州工作,系淘宝数据仓库架构师。
2月1日下午,经多方打听,记者联系上杨先生,他和妻子还在张家界。
据杨先生描述,事情大概是这样的。
1月27日晚,两人到名叫“如意东北人酒家”的饭店就餐,点了4个菜,3个菜很快上了,最后一个菜等了个把小时都迟迟未上。
杨先生就去买单了,说最后一个菜不要了。饭店女老板问厨房做了没,厨房说做好了,女老板就说不能退。
杨先生提出这个菜付一半钱,... 阅读全帖 |
|
J********n 发帖数: 215 | 4 这不是918之前的事情么?和满洲国有毛关系?
比方说要是富士康大火,郭台铭为了保iphone6仓库而没有救宿舍的火,结果烧死几千
人。难道这个要算成蒋匪军屠杀中国人?
1943
骨。
3700 |
|
g*q 发帖数: 26623 | 5 苏联粮食和肉类产量虽然高,但是没有吃到老百姓嘴里,全都烂仓库里了,老百姓真正
享用到的比现在的差。现在粮食正好够吃,还绿色环保。 |
|
s********i 发帖数: 17328 | 6 不如这个实在:
摘自:《2006年美国人权白皮书》
三、关于公民和政治权利
近年来,美国人的公民权利受到越来越多的侵犯。
“9·11”事件以来,美国政府机关以反恐为名对公民进行大规模秘密监视。据《
华盛顿邮报》和美国广播公司(ABC)2006年12月公布的一项调查,66%的美国人认为,美
国联邦调查局和其他联邦机构侵犯美国公民的隐私权。据美国司法部2006年4月28日公
布的报告,2005年在国家安全调查中,电子监控和搜查令的使用率提升了15%。联邦调
查局签发了9000多份国家安全信函,涉及3500多名美国公民以及合法逗留的外国居民。
这一数字还不包括为获得某些人的有限信息而发出的数千份其他信件,也不包括有关在
美国非法居留的调查对象的信件。国防部一个研究小组正在监视超过5000个网站,每天
关注25个至100个据称最具敌意和活跃的网站。(注27)联邦调查局内部的备忘录显示,
该机构在搜集反战示威者、环保人士以及给无家可归者提供素食的积极分子的信息。在
美国,无数人的电话记录被政府秘密搜集。(注28)据《今日美国报》2006年11月7日报
道,越来越多的企业雇主“理直气壮地监视员工”... 阅读全帖 |
|
y*******w 发帖数: 5917 | 7 你可别说,开战有些还真的立刻会清零,比如联想,号称计算机产量第一,和美国开战
,除了已经在仓库的,立刻就清零(不要告诉我可以用龙芯)。现有的玩意够用?德国
日本二战的例子摆在那里呢, |
|
m********5 发帖数: 17667 | 8 比如说,吉尼斯世界记录最大汉堡重达914公斤,直径为3米
但IT的码工说,你这个不是最大的,最大的汉堡在麦当劳
你努力思索的时候,码工说了: 人家麦当劳仓库的汉堡以百吨计!
你只能... |
|
发帖数: 1 | 9 这的确是虎肉的不对。虎肉不了解CS就不要评论。
我当年的全国(?)“优秀本科论文”(?)(我没看过奖状所以不知道)也用到了马
尔可夫的假设。带我论文的CS博士就没反应过来马尔可夫是什么东东。他的导师是中国
的院士。Present的时候导师还把他的研究生叫了来,后续工作研究生接着做。这论文
的结果/思想前两年微软用在数据仓库上了。
这些东西CS的人叫什么不care。重要性比茴香豆都比不上。 |
|
发帖数: 1 | 10 这的确是虎肉的不对。虎肉不了解CS就不要评论。
我当年的全国(?)“优秀本科论文”(?)(我没看过奖状所以不知道)也用到了马
尔可夫的假设。带我论文的CS博士就没反应过来马尔可夫是什么东东。他的导师是中国
的院士。Present的时候导师还把他的研究生叫了来,后续工作研究生接着做。这论文
的结果/思想前两年微软用在数据仓库上了。
这些东西CS的人叫什么不care。重要性比茴香豆都比不上。 |
|
C********1 发帖数: 5281 | 11 小留到美国后第一年的死亡率特别高。我已经听说很多起了。而且外国人跑到美国后的
死亡率远高于美国平均死亡率,所以楼主的统计有点问题。
我听说的死亡有:
1.多起自杀。
2.游泳池促死。
3.劳累死
4.勇救落水儿童死
5.多起亚裔妇女给奸杀
6.住APARTMENT晚上被入室强盗杀死。
7.华裔老人做仓库保管员被杀死
8.送外卖被杀死
9.加油站被枪杀
10.纽约地铁站被推下,火车轧死 |
|
n********g 发帖数: 6504 | 12 没办法,谁让俺出身“高级知识分子”家庭。
总有人意淫俺高考没考好进了三本。
就没人问有几个清华的本科毕业论文能拿“全国优秀”论文。十N年之后被某我美码工
(也许重新发现)做到当今主流版本数据库/数据仓库管理系统里。
也没有人问有几个清华的本科毕业就申请到政府资助价值200平米最贵一线城市商品房
,主持总投资3000平米最贵一线城市商品房的科研/工程课题。
我就奇怪怎么有人自我感觉辣么地好。 |
|
发帖数: 1 | 13
有道理,兔子要种大豆了,对国际上的需求自然是会减少,什么各国买美国大豆囤起来
想卖给兔子的,就得再做打算了,要不降价,要不就留在仓库自个享用
当然我对什么各国都买美国大豆想再转手加价卖给兔子的这点还是有点存疑,各种消息
来源还是得再求证 |
|
w********9 发帖数: 8613 | 14 https://www.jiemian.com/article/732716.html
1931中国大洪水:汉口变威尼斯,灾害人数8000万 | 历史
《伦敦新闻画报》以在今日看来无比珍贵的图文记述了那场发生于民国时期的滔天洪水。
沈弘 2016/07/07 09:55浏览 20.3W字体:宋
1931年,汉口,水深及腰的市场。
创始于1842年的英国《伦敦新闻画报》是世界上第一份以图像记录为内容主体的新闻周
刊。其以细腻生动的密线木刻版画和石印画,以那个时代的技术条件所能达到的最快速
度,再现世界各地的重大事件。随着印刷水平的提升,《伦敦新闻画报》逐步实现新闻
绘画向新闻摄影的转换,渐渐以摄影照片取代版画。
画报初始就对中华帝国表示密切关注,派驻大量画家兼记者,仅1857年至1901年就向英
国发回了上千张关于中国速写和几十万字的文字报道。这些珍贵的图文资料,大多是现
场的目击报道,属于第一手的原始资料;它们对于历史事件的观点和看法往往是中文史
料中所忽略的片段,它们所报道的一些事件和中国社会生活的细节往往是中文史料中的
盲点;其报道的系统性和连续性也是许多其他中西文历史资料所不能企... 阅读全帖 |
|
n********g 发帖数: 6504 | 15 沿海应该还可以。靠近在美国的战略储备仓库。太内陆人口密度低。武汉是个好地方。 |
|
h*****9 发帖数: 4028 | 16 这些都是装备的一部分。放在仓库里的,飞到天上的就不是装备了?只要用到了战场上
的,都是装备。士兵身上背的,就算没开枪,也是装备。 |
|
h*****9 发帖数: 4028 | 17 消耗量不能绝对反映装备量,但对志愿军和美军对比大致不差。你国军守着好好的后勤
仓库,完好的枪炮子弹,非要投降,不愿意或无能力开枪开炮。那就是水平问题了。 |
|
|
c*******s 发帖数: 4 | 19 来自主题: JobHunting版 - 找工作咨询 大家好,有个工作问题请教大家:我在国内软件行业工作了几年,从事CRM和数据仓库
方面的工作。曾经任职senior engineer、product manager和project manager(技术
从来没有丢)。现在的问题是:
1 我的英语不是很好,这个缺憾是否会成为找工作过程中的致命缺憾;
2 我刚刚申请了EAD,以大家的经验看,是等EAD申请下来以后再找工作的好还是边申
请边
找工作的好。
烦请大家多给意见,谢谢! |
|
q*******h 发帖数: 82 | 20 不好意思,没用过论坛的功能,回答的可能比较晚了。
Cassandra是要求反映快,输出大
Hbase反映一直很慢,做数据仓库用的。用途好像真不一样。 |
|
z****e 发帖数: 54598 | 21 是应该以尽快拿到学位为主
graphics是冷门,不学也罢
不过话可以不用说死,虽然graphics工作机会不多
但是经常会有一种情况,全班工作都找得工资都一般高
就是那个搞graphics找到的工作工资最高
data mining主要是数据仓库这些,跟big data不能说没有关系
但是还是可以分为两个不同的东西,跟传统db更为靠近
这个倒是可以学,以学方法论为主,
testing我觉得没啥可以学的,除非你将来打算做qa |
|
z****e 发帖数: 54598 | 22 你看看这家公司职位的各种要求
大概就有谱了,java很多都是senior职位的
比如他们的数据仓库组和goods组
都在招多年经验的java programmers
用的那些东西你肯定用过,熟练程度差别而已
http://jobs.groupon.com/careers/seattle
你想弄nosql, web service这些是正确的
我觉得你现在想做的基本上靠谱 |
|
a******u 发帖数: 69 | 23 做基于云计算的数据仓库。
算前30个工程师吧。加上非工程师的话公司50多人左右。
谢谢建议! |
|
G*******7 发帖数: 51 | 24 Location: Shanghai;
Title: Data Scientist
Skill&Background:
6+ expereince with Master degree OR PhD Degree with 1+ yr experience(
Internship is ok);
CS & Statistics related education background;
Good Java programming skill;
Good data mining, modeling and analyst skill;
Welcome to contact by j*****[email protected]
待遇优厚呀~~~有兴趣的朋友速速联系。类似的岗位最近比较多,有作数据仓库、
hadoop的朋友都欢迎联系呀~ |
|
b******r 发帖数: 1137 | 25 我只是就我看到的一些appraisal report归纳出来的,所以纽约附近不合理。准确一些
说,我看到的这些数据都是lower westchester的房子。如果大家有什么比较客观的数
据关于房型和房价的关系我也很感兴趣。
你所说的原因不是房型的原因,只是非直接由ranch需要用地大引起的。
appraisal的每一项东西都有自己的调价。我的比较是仅仅基于我看见的房型那一项。
也就是说,如果其他条件相同(地一样大,面积一样大,新旧相似,车库一样多。。。
),colonial相对于split相对于ranch有溢价。如果说比较是基于两项(地和房型)而
且基本上没有很多余的空地,那它们的价钱的确是差不多的,因为ranch需要更多的地。
我能想到的影响房型价差的一个原因就是energy efficiency,colonial最好,ranch最
糟。 |
|
k**v 发帖数: 1 | 26 2003,我告别了IT
维多利亚日长周末前的星期五,天空有些阴霾,平常忙忙碌碌的IT办公室里已经“人去楼
空”,同事们不是提前休假,就是在家里上班,乘机过一个“超长周末”。对于我来说,
今天却很特别,这是我在IT行业的最后一天,下个星期就到销售部门的一个小组去报到了
。最近几个星期都在忙于交接手头的工作,今天终于可以安静下来作最后的整理。很多IT
的书籍和资料,过往的内部文件,都让我大摞大摞地扔到回收箱和碎纸机里去,那一瞬间
有些许快意,轻松,仿佛卸去了肩上沉甸甸的担子,也有点茫然。快意是因为我是学版画
的,入行纯属偶然和无奈,从call centre的技术支持到数据仓库项目里写程序,手头所
有的事情都不是我的兴趣和长项,磕磕碰碰地熬到今天,总算是善始善终,给自己一个交
待。茫然是因为我毕竟做了八年,IT这行不管怎么说也算流行的专业,而新工作也并非我
喜欢的类型。在兴趣和饭碗之间,我又得做出一次折衷。
记得以前小时候写作文,都是以“我的第一次”为切入点,引出对未来的无限憧憬,很少
写“我的最后一次”,来对自己的过去进行总结。我过去的八年里,在加拿大经历了IT业
从起飞到巅峰再到不景气和 |
|
z*****5 发帖数: 66 | 27 网上一篇来自武汉大学的文章曾问过你们:
“在你们流连街头、争论不休时,武汉大学国际软件学院的学生们已经开始进行
NoSQL方面的实战,他们中有很多人已经拿到了阿里巴巴的offer,有一个全世界最大数
据量的电商数据仓库等着他们去做大数据分析;
往武汉西北1000公里,西安交大电力电气专业的学生正在三峡进行实地学习,很多
人一毕业就要奔赴雅鲁藏布大峡谷的源头,这里将修建世界上最宏伟的水电设施,他们
将在天高云淡的藏南燃烧青春;
这是怎么样的一个时代?是一个风起云涌的时代,是一个青春峥嵘的时代。在这个
时代里,香港哪里去了?亚洲排名第一的高校,你们在这个时代里忙着干什么?”
最后这句,也是我们最想问你们的。请你们谅解同龄人的直率。
你们注意到了吗?内地对港免征国税等政策,让香港企业在进军内地的“起跑线”
上具备先天优势。香港科技大学经济发展研究中心主任雷鼎鸣曾经疾呼:“假如港人懂
得利用(内地经济)沛然不可挡的发展之势,本可占尽先机!”
你们想过没有?在你反感“内地赴港自由行”时,有多少国家和地区在对13亿人的
旅游市场伸出橄榄枝?一个成熟有智慧的人,会学会适应变化的现实,学会应对、料理
... 阅读全帖 |
|
x**n 发帖数: 12542 | 28 ha, 很多年前偶在国内上班的那个公司买了个做datawarehouse的,就叫teradata.那个
时候
tb data是很吓人的,当年那个公司给walmart做的db好像最大就是16tb.机房有
一个仓库那么大,中控像个司令部。全世界到处吹。
,都有问题。 |
|
|
t****g 发帖数: 35582 | 30 ARM64如果能出来,在底端搞搞数据仓库类的server还是很有优势的。well,至少有人
这么说。
不是说了么,我不懂,所以不能轻易rule out一派的观点。所以最好的办法就是stay
aside and watch。 |
|
h**u 发帖数: 304 | 31 我校申报的1999年国家自然科学基金项目有7项获得批准,其中管理科学5项,信
息科学1项,数理科学1项。这些项目分别是:工商管理学院谢经荣教授的《房地
产业与社会经济协调发展研究》、农经系马九杰副教授、郑风田副教授的《农村
合作金融机构信用风险评估与预警模型及实证研究》、《环保约束下企业绿色战
略与竞争力关系研究》、行政管理学系毛寿龙副教授的《公共政策的制度基础》
、信息学院成世学教授、杜小勇教授的《高等破产论与风险排序》、《数据仓库
系统技术研究》和社会学系沙莲香教授的《现代企业管理的文化根基》。此次评
审,我校共获国家自然科学基金资助75.7万元,其中沙莲香教授获得国家自然基
金委主任基金的专项资助。 |
|
s***e 发帖数: 1490 | 32 【 以下文字转载自 THU 讨论区 】
【 原文由 nonamej 所发表 】
中国计算机学会悼念网站
http://www.ccf-dbs.org.cn/hongjun_lu/obituary.html
香港科技大学悼念网站
http://www.cs.ust.hk/luhongjun/
陆宏钧 男,汉族,上海人,1945年12月25日生,1968年毕业于清华大学自动控制系
,1980年在美国威斯康星大学获硕士学位,1985年在美国威斯康星大学获博士学位
。1987年任教于新加坡国立大学,1998年任香港科技大学教授。同时担任清华大学
计算机系客座教授、北京大学计算机系客座教授、复旦大学客座教授。
陆宏钧教授被国际学术界公认为领先的数据库研究者,特别是在数据查询处理
与优化,数据仓库与数据挖掘,XML数据管理等领域方面有突出贡献。他长期致力于
科研事业,在许多高质量学术刊物和国际会议(IEEE TKDE, VLDB, ACM SIGMOD, I
CDE, CIKM, EDBT等)发表了200多篇研究论文;直到近年,仍是一位高产的研究学
者,在SIGMOD'04发表一篇,VLD |
|
g*****g 发帖数: 34805 | 33 cloud当然有其价值,中小企业没有能力自己创建和维护
数据仓库,租用云。起始成本低,能够承受高峰冲击,日后
可以无缝扩展。而且安全,病毒这些东西可以统统不管。
从开发的角度看,并不见得比在自己管理的服务器上复杂多少。
AC2是给一个虚拟主机让你自己管,除了一些脚本其实是一样的。
Google Apps的接口要高一些,相当于给了一个应用服务器,
只要写应用就行。 |
|
r*****3 发帖数: 143 | 34 中文名: 数据库系统基础 (第6版)
原名: Fundamentals of Database Systems
作者: Ozsu
Valduriez
Hellerstein
Stonebraker
Halpin
Groppe
Garcia-Molina
Ullman
Widom
Laszewski
Elmasri
Navathe
图书分类: 软件
资源格式: PDF
版本: 文字版
出版社: Springer
书号: 978-1-4419-8833-1
发行时间: 2011年
地区: 美国
语言: 英文
简介:
内容简介:
本书是一本非常适合作研究生数据库教学用的教材。其内容包括了分布式数据库所用的
基本原理、方法、重要的算法介绍及部分系统的实际实现技巧。新版还增加了一些新的
内容如:用整整两章来介绍并行数据库和分布式对象数据库管理系统。
本书具有以下特点:1.内容较为全面,系统地覆盖了分布式数据库的主要方面;2.反
映了目前的一些研究成果如:数据仓库,万维网和数据库,基于推理的技术以及移动
DBMS;3.叙述清楚,容易阅读。
目录:
preface
1 1 ntroduction
1... 阅读全帖 |
|
t*******g 发帖数: 2 | 35 各位大牛们好啊,小弟现在是CS master 在读,现在拿到了一个暑期intern的机会。是
在IBM。 经过几轮面试后,人家现在给了我两个职位选择。一个是BI,一个是BA的。我
不知道该如何选择啊,我在的也是个小破学校,能拿到这样的机会挺不容易的,基本上
我打算如果人家要我,我就一直在这实习然后就作为第一份工作了。 我对数据库了解
的也不是特别多,数据仓库和挖掘都是自己看书的。然后我对编程这块不是特别有兴趣
,平时用C多一点,写过3,4W行吧。java和.NET连1W行都不到。
我真的不知道该如何选择了,所以就连版上问问大家。 谢谢啦
(另问问对于BI和BA,现在国内的形式如何啊?) |
|
|
|
z***y 发帖数: 7151 | 38 这种测评,大家你一板砖我一板砖互拍了十几年了。 你想那SQL Server 7出来的时候
就敢和 oralce 8互拍, 由于太扯蛋,弄得微软自己的销售都很脸红的说。。。
微软在数据库引擎方面照oracle还差些, 但是差距越来越小了。
数据仓库这一部分绝对比oracle 强。 我上个月在微软看到一个内部demo, 是下一代
sql server,能做load balance, 还没有代号, 他们称为maxtirxDB, 呵呵。。。 |
|
c*******e 发帖数: 8624 | 39 ☆─────────────────────────────────────☆
gwood333 (greg) 于 (Sat Mar 14 20:16:52 2009) 提到:
是做ERPdba还是大型数据库,数据仓库DBA值钱。
☆─────────────────────────────────────☆
wildhorse (黑马 -- 我是珠丝) 于 (Sat Mar 14 21:42:45 2009) 提到:
这年头, 能有offer就不错了
☆─────────────────────────────────────☆
Assailant (反恐精英 勇救人質 精拆炸彈) 于 (Mon Mar 16 14:11:48 2009) 提到:
"DBA的最高工资有多少"
$200k?
☆─────────────────────────────────────☆
Beijing (学什么都不如有绿卡) 于 (Mon Mar 16 18:04:03 2009) 提到:
zan, far away from this number
☆──── |
|
h********e 发帖数: 207 | 40 刚刚在dbworld的maillist上又看到他家的找人广告,PhD preferred。
听我朋友说,她一个朋友在那个公司,据说今年他们的确效益不错,不但一个人都没裁
,现在还有不少opening。听说他们家的数据仓库的技术是最好的?有PhD的可以试试阿。 |
|
c*****d 发帖数: 6045 | 41 我也听说他家的数据仓库很好
wyr和luckyseeker给介绍介绍?
阿。 |
|
h**e 发帖数: 410 | 42 考的是字符串输出,我也答的不好,光看数据库,数据仓库,数据挖掘,Java我以前在
学校作过好几个projects,多年不用手生了,我光看EJB,J2EE,servlet,OOD, C++等概
念,java coding没有注意到,以为电面不会考,唉,人算不如他算阿。
对了,还有一个是考procedure的body package,这是概念题。 |
|
g***l 发帖数: 18555 | 43 是做DATAWAREHOUSE,数据仓库,你要听了周四的讲座,应该有个大概的了解。 |
|
|
|
s**********o 发帖数: 14359 | 46 任何一个APPLICATION都要有数据库的,不同平台要求的技术也不同,数据库开发基本
是指直接和数据库相关的,比如SQL QUERY, STORED PROCEDURE, TRIGFFER,数据仓库
,DATA MINING,ETL |
|
q****e 发帖数: 511 | 47 做计算机没有搞合适的,只有搞最热的。
比较热的是
1) dynamic网站的开发。J2ee, html + javascript ,或 ASP dot net (可能有别
的新名字了)
2) 数据库,如DBA, 数据库开发,数据仓库等 Oracle, sqlser 等
3) 然后是一些大型系统专业软件的应用 如SAP,SAS,Reporting tools 等。
4) 还有什么unix admin,sysco admin 这类的
5) c/ c++ 底层编程估计到g 家,A 家等大家还是很流行的。 |
|
e****7 发帖数: 4387 | 48 LZ要做的是一个挺classic的existence count.
database design 是普通的many to many relationship. 也有叫intersection table,
或 bridge table 的。 数据仓里的faceless fact. 这个measure 就是count.
这个fact可以intersect其它的dim.例如time.
也可以做成snapshot, at different grain. depends on requirement. |
|
e****7 发帖数: 4387 | 49
LZ用的是什么后端,如果是relational dbms, 而且数据量不大,报表有比较简单,
dimension model (star) 未必划算。如果量大,有olap engine做后端, 用来做
analysis 或复杂些的report, 不是一般的好。 |
|