关于分布式计算的讨论汇总 - 话题女王

全部话题 - 话题: 分布式计算

k*******7
发帖数: 18

来自主题: Classified版 - 求内推，分布式计算和网络规划方向的EE phd

大家好！
小弟是一个EE专业第四年的phd。最近开始找工作，深感EE专业的学生找码工工作的郁
闷，投出去的简历大部分都渺无音讯或者被拒绝。希望版上已工作的大大们能帮我内
推一下。我的科研方向是分布式和并行计算里的负载切分问题和智能电网里的负载均
衡问题，之前上的课大部分是网络和分布式计算的。从今年初打算转马工起自学c++，
算法，也做了几遍leetcode和cc150. 但是没有上过计算机方面的专业课如操作系统和
计算机结构等等。如果版上已工作的大大知道哪有我可以干的工作，希望帮我内推一下
。
我的邮箱是： k************[email protected]
谢谢

k*******7
发帖数: 18

来自主题: JobHunting版 - 求内推，分布式计算和网络规划方向的EE phd

N******K
发帖数: 10202

来自主题: Programming版 - 分布式文件存储系统，以及此基础上的分布式计算，大家有何推荐的？

说是hdfs小文件有问题单点namenode问题
文件不是以文件系统的格式存储升级迁移不方便
hadoop的map reduce 并不代表所有的分布式计算

f******1
发帖数: 73

来自主题: Immigration版 - 审稿机会-分布式计算，云计算，大数据，通信和能源互联网

第五届网络和分布式计算国际会议将于今年10月份在美国MIT召开，会议诚邀请愿意做
程序委员会委员的有识之士审稿，会议会勇Easychair系统，提供正式的审稿证明邮件
以便申请绿卡时用，根据以往经验大概每个审稿委员有3-5篇文章。作为PC Chair，我
很愿意为您提供需要证明您审稿优秀的辅助性邮件（其实我本人也在申请绿卡，所以深
知其重要性）。
会议的网站做好了80%，后面还会继续完善，请参见如下链接：http://fanzhangmit.wix.com/icndc2014
请讲您的姓名，所属单位，email发到我的邮箱（f*****[email protected]），最好附上一份个
人简历这样我可以根据您的专长针对性的选择适合您审稿的文章。多谢您的关注。

b*****d
发帖数: 208

来自主题: Go版 - 新的阴谋论：分布式计算

新的阴谋论登场了。
“阿尔法狗采用的是分布式计算，通过网络收集人类高手的研究信息，然后选择最好的
招法。”

t**d
发帖数: 6474

来自主题: Go版 - 新的阴谋论：分布式计算

分布式计算主要是用多台电脑并行运算和搜索数据库。

l********o
发帖数: 5629

来自主题: WaterWorld版 - 美帝体制是分布式计算，我鳖太落后了

【以下文字转载自 Military 讨论区】
发信人: liyuanchao (李源潮), 信区: Military
标题: 美帝体制是分布式计算，我鳖太落后了
发信站: BBS 未名空间站 (Tue May 14 19:51:36 2013, 美东)
我鳖的中央集权体制，类比于计算机刚刚开始的时候只有一个cpu，一切事情
都要中央做主。效率低下。
美帝则不然，美帝很多事情都是基层解决了，基层有无数个小cpu.
美帝强大之处就在于此。美帝是一个强大的中央处理器加上很多小的处理器。
我鳖只有一个中央处理器。
不管什么资本主义还是社会主义，管理中国和美国这样巨大的国家(类似于海量数据处
理）
，显而易见是美帝的制度更加先进高效。
我鳖遇到新的问题的时候，不是想着从结构上解决问题，而总是想着在现有框架内
打补丁。大的构架不改，补丁打再多也没用。

n******g
发帖数: 2201

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

实际有用的都是小数据大数据其实是大垃圾
然后分布式计算远不如单机快 Hadoop spark 也不如 MPI
为啥技术倒退的这么彻底呢

f*******t
发帖数: 7549

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

一堆性能一般的硬件：性能有损失，需要更多开发人员
高性能硬件：性能强到一定程度后费用大概会几何级增长，failover难，而且很多时候
单机还是满足不了大公司的需求
大公司又不是傻子，搞这些分布式计算的技术，当然是因为能降低成本。以更低的成本
做到了同样的事，怎么看都是技术进步吧。附带的效果是硬工需求和收入降低，钱转移
到码工手里。楼主可能是一个悲愤的硬工。

n******g
发帖数: 2201

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

实际有用的都是小数据大数据其实是大垃圾
然后分布式计算远不如单机快 Hadoop spark 也不如 MPI
为啥技术倒退的这么彻底呢

f*******t
发帖数: 7549

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

l*****y
发帖数: 2522

来自主题: Military版 - 透明计算再掀风波，饶毅主编的《赛先生》两次批张

“
饶毅、鲁白、谢宇三位学者主编的《赛先生》 ── 与科学同行，关注科学与文化。
(欢迎个人转发分享，刊物和机构如需转载，请联系授权事宜)
”
转两篇文章：
文章一：
有争论才是正常的科学（zt）
2014年1月24日发

编者的话
具有批评性是科学工作者的基本素质。科学的批评是为了建设，在能够答复各种批评后
才能确立新的发现和理论；即使伟大如牛顿的科学成就也能被批评，被爱因斯坦推翻更
好，因为了带来伟大的科学革命。科学的争论不仅可能针对科学内容，也可能针对科学
评价。动用行政禁止批评等于禁止科学的进步，动用人际关系回避批评等于推翻科学常
规。司局级单位主持的评审、大学校长得奖引起我国科技界争议，却出现：《澎湃新闻
》《财新》有关报道被删除；计算机学会的建议被拿下、其媒体沟通会被取消……凡此
种种令人疑惑之事何以在“赛先生”进入中国百年后发生？《赛先生》认为：奖项本身
乃小事，我国建设科学精神为大事。

文章内容：
由科技部国家科学技术奖励办公室主持的科技奖评审有时引发争议，不仅在科学界不是
洪水猛兽，即使在中国社会也不是很大的事，关心的是科技小众。

2015年1月... 阅读全帖

p**********r
发帖数: 1693

来自主题: Hardware版 - 请问有没有Nvidia GPU在CUDA上计算的benchmark

boinc是伯克利大学搞的一个开放式分布式计算平台，志愿者帮科研单位利用pc空闲能
力做计算，我上面给的链接是其中一个特殊的项目，专门统计各种机器计算效率的；目
前支持显卡计算的分布式项目有不下十个，跟生物有关的n卡项目我只记得gpugrid，你
可以查查她们用哪种方法计算.
folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台，比boinc早了好几
年，是影响力和志愿者人数最多的分布式项目，单核cpu，多核cpu，a卡
n卡都支持；folding point per day是一个衡量显卡通用计算能力的比较直观的数据，
好多新卡评测里有这一项，网上统计数据比较多，又是做生物计算的，你可以重点查查
这是一个中文社区，没什么学术价值，你可以看看当科普了
http://www.equn.com/wiki
http://www.equn.com/forum/forum.php

f***e
发帖数: 5443

来自主题: Military版 - 透明计算的前世今生

透明计算的前世今生——缘起
作者：小兵张三
起疑
听说2014年度国家自然科学一等奖没有空缺，先是高兴，毕竟这是代表国家
实力的奖项，可看完新闻，感觉完全不是那么回事了：“网络路由器之父”、
“颠覆冯·诺依曼体系”、“透明计算”这些大词以前怎么从来没听说过？
众所周知，路由器就是网络设备，不存在什么“网络路由器”，而路由器进
入中国是以思科为代表的。查查维基百科【1】，多协议路由器首次出现于1981
年的Stanford和MIT，发明人分别为William Yeager和Neol Chiappa，而作为路
由器功能的设备，更可追溯到ARPANET建设时期的Interface Message Processor，
跟中国真是扯不上半毛钱关系。
冯·诺依曼体系提出了“存储程序”的概念，是现代计算机的基础。用大白
话来说就是，计算机由中央处理器（CPU）、存储器和输入输出设备三部分构成，
程序加载存放于存储器之中，并通过CPU来执行。此体系的提出，是因为早期的
计算机类似于现在的计算器，只能为单一的用途服务，而基于冯·诺依曼体系设
计的计算机，可以通过编写不同的软件，让计算机具备多样的功能。... 阅读全帖

f***e
发帖数: 5443

来自主题: WaterWorld版 - 透明计算的前世今生

c****e
发帖数: 1453

来自主题: Programming版 - 分布式文件存储系统，以及此基础上的分布式计算，大家有何推荐的？

这个fastDFS有什么不一样？分布式文件存储，现在这一波都是抄的bigfile,万变不离
replication.至于meta data怎么放，可以集中也可以分散。上面有计算的，能变的花
花肠子就是计算的locality和更有效的filtering,所以一窝蜂的去做column based XXX
.

d******c
发帖数: 2407

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

这完全是个成本问题。
MPI只有super computer上用，都是政府出钱的计算中心，企业用是不合算的。
当初google的问题超过了单机的容量，必须用大量pc拼起来。
现在单机的能力很强了，很多人的数据也远没有那么大，搞分布式肯定是不需要的。
但是会有一些问题还是单机处理不了的，另外就是一个scale问题，你现在单机能处理
，但可能希望数据大了你仍然能处理，用分布式的话可以scale up，用单机很快就到极
限了。
分布式，并行都是需要完全不同的计算模式，只有必须要用的时候才应该用。

d******c
发帖数: 2407

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

t******a
发帖数: 140

来自主题: Military版 - 透明计算与云计算----程京德

透明计算与云计算 (2013-08-26 05:54:47)转载▼
标签： it
本文对由中国学术界提出的“透明计算”和由美国产业界提出的“云计算”从背景、动
机、目的、特征等各个侧面给予比较之后，给出的主要结论为：先于“云计算”提出的
“透明计算”具有原创的思想、明确的动机、清晰的概念、创新的结构，激起新的技术
挑战，从学术上看可以称之为一种新的计算模式；而后于“透明计算”提出的“云计算
”仅仅是一种新的商业模式，从学术上看没有原创的思想和明确的动机，其概念模糊、
结构纷杂，在技术上为传统分布式计算（网格计算）的继承延伸，因而难以被称之为一
种新的计算模式。本文也对有关“透明计算”和 “云计算”的一些热点问题阐述了笔
者的观点看法，对“透明计算”和 “云计算”各自所面临的技术课题以及将来的互补
发展给予展望。
原文：" 透明计算与云计算"，未来计算：讨论和展望，中国工程院国际工程科技发展
战略高端论坛，东北大学出版社，pp. 22-33, 2013年8月.
http://www.aise.ics.saitama-u.ac.jp/~cheng/essays/FFC2012book... 阅读全帖

f*******a
发帖数: 663

来自主题: Programming版 - 【请教】该选择哪个云计算平台？

单机的科学计算做多了，不知不觉已经落伍。最近遇到这样的系统需求，希望采用云平
台来实现。看着一堆的新术语和AWS, hadoop, BOINC, ROCKS等平台介绍，实在没有什
么概念。经常看见这里高手出没，所以前来请教，恳请各位指教，非常感谢！
=====================================================================
大体上而言，这是一个包含两种节点的数据采集分析应用的框架。
第一类节点是大量数据采集节点，负责数据采集、预处理及发送。
第二类节点是运算分析节点，统合所采集的数据，进行综合处理分析，以用于后端应用
及服务。可能包括超级运算节点，统合大量的分析数据。同时负责局部区域的数据存储。
1. 可连接性需求
a) 局域网情况。有些实验场景条件所限只能布设单纯的局域网。
b) Internet情况。节点可能在局域网内，无独立IP。
2. 数据传输需求
半实时自动同步至云平台（例如比实时延迟5～10分钟），而后运算节点即可分析相应
数据。目前的传输需求大概是 5~10MB/min(对每个数据采集节点)，但有可能会有... 阅读全帖

s*****n
发帖数: 1636

来自主题: ChinaNews版 - 世界最大超级计算机利用百万处理器模拟计算

美国北加州的斯坦福大学，研究人员刚刚利用世界上最大的超级计算机运行了一个应用
程序，通过一百多万个处理器核处理了相关信息。
约瑟夫·尼科尔斯及其研究小组是第一个利用劳伦斯·利弗莫尔国家实验室的“红
杉IBM蓝基因/Q型”超级计算机运行活动代码的研究团队。“红杉”超级计算机总共包
括150多万个处理器核，该研究小组利用的处理器核有一百万稍多一些，模拟了试验性
喷气式发动机所产生的噪音量，在这个过程中显然创造了一项超级计算机纪录。
以前，尼科尔斯及其他研究小组成员从来没有在超过20万处理器核的计算机上运行
过这个代码。为了使“红杉”的软件达到最优化，在过去几周的时间里，研究小组跟劳
伦斯·利弗莫尔国家实验室的研究人员进行了密切合作。“起初我也不知道能否正常运
行，”尼科尔斯说。
分布式计算工具的开放资源，如Hadoop，利用的是非常便宜的商品硬件。试验表明
，尽管这些开放资源已经发展起来，但是以前的超级计算机群所提供的数据处理平台仍
然要大得多。最大的Hadoop集群可能包括大约8800个处理器核。
超级计算机的工作原理是把非常大的问题分解为较小的问题，然后把这些小问题分
布在许多机器和许... 阅读全帖

l***0
发帖数: 9

来自主题: JobMarket版 - 全球知名IT企业云计算首席架构师职位北京

你好
我是猎头顾问lena，我们目前有个国内一线IT公司的big data首席架构师的职位:
1 有云计算底层基础架构的搭建经验，熟悉大规模分布式计算、虚拟化和存储技术
2 有成功的云计算软件产品研发背景，而不是单纯的研究人员
如有兴趣，请回复您的最新简历一份，留下您的手机号、邮箱等联系方式就职位详情进
行深入了解与沟通。
邮箱：w*******[email protected]

r********3
发帖数: 2998

来自主题: CS版 - 云计算为什么还需要xen cloud之类的middleware？

早就给你说了，虚拟化技术决定你云计算的水平，而不是什么分布式计算。还有，什么
独立的process？一般企业一套系统哪里才一个process？现在连一个firefox, chrome
都要独立好几个process了。
另外，谁告诉你不需要数据管理了？那客户的数据放哪里？我有点不太明白你的问题。
你似乎对于云计算的本质有理解上的偏差。

security的问题，交给https好了。

b**********l
发帖数: 116

来自主题: DataSciences版 - 小白弱问，并行和分布计算区别，gpu和spark区别？

现在似乎spark很火，比hadoop流行了。。。
然后又总看一些seminar是nvidia公司支持的讲gpu啊cuda啊什么的。。。
请问spark/hadoop和gpu啊mpi啊是什么关系啊？貌似都很流行所以不是一回事吧？没有
谁替代谁的关系吧。。。
那一般说的high performance computing指的是gpu计算？
比如我要算个大的距离矩阵，想要算得快点，是用spark啊还是gpu啊（虽然我都不会）
？那这个叫并行计算还是分布式计算啊？
多谢。。。求科普。。。

z****e
发帖数: 54598

来自主题: DataSciences版 - 小白弱问，并行和分布计算区别，gpu和spark区别？

并行计算主要是单机内多个线程的并行
分布式计算主要是涉及到网络的多节点的计算
区别点应该主要是网络

x*******1
发帖数: 28835

来自主题: Go版 - 新的阴谋论：分布式计算

这还需要分布式？现在1个T的内存，把古今中外，各个时期的棋谱全装了，也没啥难
的。不就是时间序列的2位数组么。

j**u
发帖数: 6059

来自主题: Computation版 - [合集] 搭一个小型分布式计算服务器组的问题，急！

☆─────────────────────────────────────☆
pinacle (大石头) 于 (Thu May 10 01:11:44 2007) 提到:
比如16台server，或者4台quad core，用来做分布式实时仿真，总共需要的电源功率大
概在什么范围之内？多谢
☆─────────────────────────────────────☆
seki (瓜金) 于 (Thu May 10 10:31:09 2007) 提到:
my guess: ~3k Watt?

☆─────────────────────────────────────☆
longtian (施主，小僧已经很久不烧香了) 于 (Thu May 10 14:15:53 2007) 提到:
5kw?
你还是看看你要买得server的功率吧
☆─────────────────────────────────────☆
rossby (五十岚已夜) 于 (Thu May 10 15:34:01 2007) 提到:
plus UPS,

d********9
发帖数: 38

来自主题: Quant版 - 面试quant position需要准备分布式计算吗

RT.要面一家hft的quant developer职位，description里提到需要big data set处理和
分布式的经验。想请教大家hft里常用哪些distributed computing的方法，版上没有搜
到相关的帖子。
先跪谢了

f***e
发帖数: 5443

来自主题: Military版 - 15分钟实现透明计算

15分钟的教程是说明达到透明计算的演示，15分钟就ok
分布式计算参考：
http://en.wikipedia.org/wiki/Berkeley_Open_Infrastructure_for_N

x*******1
发帖数: 28835

来自主题: Military版 - Cloud /分布式计算目前还没发取代炒蒜当然炒蒜永远没

除了科学计算那些没有经过优化的应用，现在哪个应用需要Exascale 级别的计算力？

a*******g
发帖数: 3500

来自主题: Military版 - Cloud /分布式计算目前还没发取代炒蒜当然炒蒜永远没

科学计算还没经过优化?
你知道真实问题有多么庞大吗?
根本不是计算机那可怜的算力能解决的

: 除了科学计算那些没有经过优化的应用，现在哪个应用需要Exascale 级别的计
算力？

:

s*****r
发帖数: 43070

来自主题: Military版 - Cloud /分布式计算目前还没发取代炒蒜当然炒蒜永远没

阿尔法狗不是密集计算
[在 registerZ (rz) 的大作中提到：]
:我可能才疏学浅，感觉cloud只能处理密集数据，却解决不了密集计算的问题。

发帖数: 1

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

超算确实非常贵，相对于普通商业数据中心，特别是跟风上了专业gpu的。超算应该是
拉不下脸用价廉物美的游戏卡的。
但是另一个方面基本上超算都是接近满负荷在运行，而商业数据中心包括云计算公司，
平均负载只有15-20%。所以究竟哪个性价比高还不好说。商业数据中心的低负载是商业
面试的周期性决定的，也是云计算的起因之一

: 不是退步的问题，是用途问题

: mpi 门槛太高。用着费劲。

: 另外绝大部分人只有几十个TB，单机处理其实没有问题。非要嚷嚷着要上大数据
，是自

: 己找事。

: 等你真有几百个pb的数据的话单机就没戏了。

发帖数: 1

来自主题: Military版 - Cloud /分布式计算目前还没发取代炒蒜当然炒蒜永远没

我可能才疏学浅，感觉cloud只能处理密集数据，却解决不了密集计算的问题。

l********k
发帖数: 14844

来自主题: Hardware版 - 用于科学计算的单机该怎么配

matlabpool 支持本地多核以及分布式计算。

n******7
发帖数: 12463

来自主题: Hardware版 - 求用作matlab计算的电脑配置

我老是忘记AMD共用核心的事情，只看core数有些虚夸了
你这个64core，只算浮点核心的话，也就32个吧
单核性能估计也不如intel同价位的
性价高是不是因为AMD的四路cpu/主板跟Intel的E5在一个价格范围，可以通过堆CPU来
达到多核心？Folding@home是分布式计算，核心数应该可以弥补单核性能的差距
超频这些事情，只能自己玩玩
单位的IT都是多一事不如少一事，不会给自己找麻烦的

n******7
发帖数: 12463

来自主题: Hardware版 - 我的机器提高计算速度的的潜力有多大？

就是跟串行的比较
1个core 要200h
64个core 只要1h
明显不对
不过paper已经发了
也没人管了
我感觉并行最关键的还是问题的领域
我们领域的问题基本都是高度可并的
其实单机并行我已经觉得很爽了
现在版上的千元双路机都有16核32线程
单机并行就可以缩短运行时间一个数量级
很客观了
也准备找机会玩玩MPI，一直对分布式计算很有兴趣

h**********c
发帖数: 4120

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

前面说过depreciation的问题，现在一些关键设备，计算设施换到云端的，3，5年之后
depreciation, 可靠性差带来的outage,这些成本估计就不是今天的报价了。
有些系统，比如电力，民航，折腾出去了就不好再折腾回来了。
倒时候，LAXIGILE MANAGERS换了好几茬，估计又是纳税bail out.

m*****n
发帖数: 3575

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

有的算法需要推演很大量，例如Alpha Go的算法
有的算法是模糊判断，例如判断猫脸
计算能力提升了，的确可以实现算法
传统统计规律能揭示的规律毕竟是有限的。

g*********9
发帖数: 1285

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

把Big Data和MPI比，这个不可思议。两个解决不同的问题，哪有可比性？
Big data是侧重处理数据， MPI是侧重计算。数据量一大，MPI怎么用？
MPI能做的，Big data肯定能做，只是没那么优化。

y**b
发帖数: 10166

来自主题: Programming版 - 分布式计算大数据啥的我咋觉得是倒退？

是的完全不可比较。
其实人类超算那点计算能力也很小很可怜的。

z****e
发帖数: 54598

来自主题: DataSciences版 - 我觉得关于datascience最近看到的几个有价值的贴

jvm也是c写的，最终什么都是c，但是c和汇编都太底层了
跟人的思维接不上，人毕竟是人，不可能完全用机器的思维方式去思考和书写语言
整个计算机系统就是层层封装的结果
并行计算跟分布式计算是两回事
并行计算很多时候对于单机更有意义，共享内存这些
分布式计算一定涉及网络连接，分布式计算不在乎甚至有意识地破坏某些nodes
以测试整个系统的健壮程度，比如chaos monkey，就是要让某些nodes fail掉
看看系统work不work，并行计算用得比较多的是hpc，而不是分布式系统
分布式系统因为nodes上各种乱七八糟的系统什么良莠不齐
所以找到一个统一的平台非常重要，否则每个node都要求定制软件，工作量太大
jvm是目前能找到的最好平台
其他语言要么效率比不过jvm，要么就是兼容性比不过java
hpc上的mpi这些到还真是用c比较多，物理系什么都很喜欢写pbsscript
然后提交hpc排队，执行后看结果，并行计算和分布式计算有一些共性和重叠
但是毕竟不是一个东西，不同的topics
从效率上说，效率提升不只比单线程的效率
是多线程，多进程的效率提升，能并行处理的部分越多，可以... 阅读全帖

z****e
发帖数: 54598

来自主题: DataSciences版 - 我觉得关于datascience最近看到的几个有价值的贴

k*****u
发帖数: 1688

来自主题: Programming版 - 国务院关于印发新一代人工智能发展规划的通知

应该是到了组建公司的时候了
板上的兄弟们要不要团结起来，振兴中华？
实在不行，还可以贩卖海外各种知识视频，要是天朝真的封网的话，youtube上大量优
质视频可以加工加工转卖了
国务院关于印发
新一代人工智能发展规划的通知
国发〔2017〕35号
各省、自治区、直辖市人民政府，国务院各部委、各直属机构：
现将《新一代人工智能发展规划》印发给你们，请认真贯彻执行。
国务院
2017年7月8日
（此件公开发布）
新一代人工智能发展规划
人工智能的迅速发展将深刻改变人类社会生活、改变世界。为抢抓人工智能发展的重大
战略机遇，构筑我国人工智能发展的先发优势，加快建设创新型国家和世界科技强国，
按照党中央、国务院部署要求，制定本规划。
一、战略态势
人工智能发展进入新阶段。经过60多年的演进，特别是在移动互联网、大数据、超级计
算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下，人工智
能加速发展，呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征。
大数据驱动知识学习、跨媒体协同处理、人机协同增强智能、群体集成智能、自主智能
系统成为人工智能的发展重点，受脑科学研... 阅读全帖

g*******u
发帖数: 107

来自主题: JobHunting版 - 代发天猫，蚂蚁，阿里云，淘宝几个技术职位，有意者请跟猎头联系

我是Jason，可以看下阿里巴巴的职位介绍，希望可以有合适的朋友介绍。我的电话是
15011062705，公司邮箱是[email protected]
/* */，个人邮箱是[email protected]
/* */。
天猫
岗位描述 1.参与创新供应链和供销平台各体系产品需求分析和研发工作；
2. 新供应链和供销平台业务架构和系统架构，以及架构的持续推广和落地；
3. 参与重大项目架构设计.开发.调优；并解决各种疑难杂症,系统优化，帮助系统架构
完善
4. 为团队引入创新的技术.创新的解决方案，用创新的思路解决问题；
5. 核查开发人员的系统设计和代码质量，规范团队技术文档和代码规范，提升团队整
体技术能力。
岗位要求 1.五年以上大规模分布式系统应用架构设计与研发经验，精通Java EE.
SOA.OSGI等相关技术；
2. 对各种开源的框架如Spring.Hibernate等有深入的了解，对框架本身有过开发或重
构者可优先考虑；
3. 熟悉分布式. 多线程及高性能的设计与编码及性能调优；
4. 较强的表达和沟通能力；具备严谨和高效的工作作风... 阅读全帖

d**e
发帖数: 6098

来自主题: JobHunting版 - [合集] System design总结

☆─────────────────────────────────────☆
peking2 (scala) 于 (Tue Mar 19 14:28:11 2013, 美东) 提到:
1. System design 是一个很大的话题，大的System一般都是由Architect来设计的，因
此就算工作过若干年的也未必有很丰富的system design的经验。如果想对system
design有一个初步了解，我发现这个文章不错，http://www.palantir.com/2011/10/how-to-rock-a-systems-design-interview/。
2. 因为我们jobhunting的主要目标集中在了FLGT等互联网公司，因此在这个范畴里的
system design也就集中在了分布式计算和分布式存储的design上了。想对这些设计理
念有个大体的了解可以读读Google的三驾马车，GFS, MapReduce和BigTable。
3. 有大牛建议读读各个公司的engineering blogs，我觉得是非常好的建议。不但能学
习system des... 阅读全帖

T*R
发帖数: 36302

来自主题: Military版 - 一个老师怎么有这么多钱，索南们以为呢

不少了，过亿的估计不下10个。包括药学，计算机，生物。
这个是美国华人教授首富。他的一个女学生资产也过亿美元。
李凯，男，1954年生，著名美国常青藤名校普林斯顿（Princeton）大学教授，1977年
毕业于吉林大学，1981年毕业于中国科学技术大学研究生院[2] ，1986年于耶鲁（
Yale）大学取得博士学位，后于普林斯顿大学任教。
在计算机领域特别是分布式计算取得杰出的研究成就，提出了分布式存储（
Distributed Shared Memory,DSM）的设计思想, 对后来的分布式计算，并行计算甚至
今天的云计算都有深远的影响。
后来又在硅谷（Silicon Valley），创办Data Domain公司，被EMC高价收购。
其培养的学生都在美国学术界占有自己的一席之地，比如Stanford的Pei Cao， UIUC的
Yuanyuan Zhou.李凯老师是当今华人计算机研究领域最有影响力的人物之一。
业界贡献：在一些论坛上，提及李凯总伴有一个“华人教授首富”的称号，这是因为李
凯2001年与人共同创办了Data Domain公司，后来于2009年被EMC以21亿美元... 阅读全帖

r******r
发帖数: 700

来自主题: JobHunting版 - 如何秒杀99%的海量数据处理面试题

海量数据处理：十道面试题与十个海量数据处理方法总结
作者：July、youwang、yanxionglu。
时间：二零一一年三月二十六日
说明：本文分为俩部分，第一部分为10道海量数据处理的面试题，第二部分为10个海量
数据处理的方法总结。
本文之总结：教你如何迅速秒杀掉：99%的海量数据处理面试题。有任何问题，欢迎随
时交流、指正。
出处：http://blog.csdn.net/v_JULY_v。
------------------------------------------
第一部分、十道海量数据处理面试题
1、海量日志数据，提取出某日访问百度次数最多的那个IP。
首先是这一天，并且是访问百度的日志中的IP取出来，逐个写入到一个大文件中
。注意到IP是32位的，最多有个2^32个IP。同样可以采用映射的方法，比如模1000，把
整个大文件映射为1000个小文件，再找出每个小文中出现频率最大的IP（可以采用hash
_map进行频率统计，然后再找出频率最大的几个）及相应的频率。然后再在这1000个最
大的IP中，找出那个频率最大的IP，即为所求。
或者如下阐述（雪... 阅读全帖

r******r
发帖数: 700

来自主题: JobHunting版 - 如何秒杀99%的海量数据处理面试题