j*y 发帖数: 320 | 1 如果是需要较大内存但是对整体计算性能要求不大,主要是一些服务器的应用,
一般建议淘个二手的Xeon的带大内存的服务器或者工作站,很多公司升级机器会淘汰一
些前代的Xeon系统,不带OS。没关系,对华人而言自己装个OS不是难事。
如果对计算性能有要求,可以配一张Tesla计算卡或者Xeon Phi卡。前一些时候,Xeon
Phi卡很便宜,$150-$300能搞定,但是就是没有散热,如果自己能DIY水冷散热系统,
无疑还是很强大的。Nvidia 的Tesla则比较贵。如果你用的CPU不是Xeon系统,对ECC校
验不是那么追求,可以有相对廉价的替代方案,那就是用GTX titan卡。现在很多打游
戏的升级显卡,淘张便宜的二手GTX titan卡做计算还是蛮实用的,titan卡自己带有散
热装置,不必自己另配,也算省了很多事情。不管Tesla计算卡、Xeon Phi卡还是GTX
titan卡,都是双精度计算 1 TFlops量级的。如果这个量级的计算性能还不能满足你的
需求,那么你只能搞个大型机或者去买超算中心的服务了。
如果计算任务不重,特别是没什么双精度类型的那些科学计算,一般而言,4核或者6核
的i7带k的桌面系统够用了,即便是3D渲染也用不到双精度,一般的游戏显卡也足够了
。所以不是很繁忙的计算,偶尔用一下3D渲染或者视频编辑,业余再打一下游戏,我觉
得 i7-5820k + GTX 980ti,就是性价比很好的顶级配置了。其实i7-4700k + GTX 980
也是足够了,应付这些基本都绰绰有余。内存32GB则足够。另外,对于Adobe CC的应用
和Autodesk CAD/3D MAX/Maya的应用,GTX系列卡足够用,其表现并不比专业卡差,当
然显存越大越好。( CATIA、Pro/ENGINEER、SolidWorks、Siemens NX 这些个软件就
别用游戏卡了。游戏卡都不可用,Nvidia的Quadro或者AMD的FirePro才是正确的选择。)
另外,想玩CUDA但是不是特别在意计算精度,单精度性能也足够的,这样的需求,我更
是建议GTX 980ti 和Titan X。其实GTX 980ti 和Titan X也是支持CUDA的,特别是CUDA
7.0。安装CUDA时,注意安装时的各种选项。There is an option when installing
CUDA to skip the driver installation. You should (de-)select that option and
retain your current driver. Beyond that, CUDA should work correctly. 不然,
用缺省的选项,是安装不上CUDA的,会说你的卡和CUDA不兼容。GTX 980ti 和Titan X
的双精度能力远不及上一代显卡,甚至还不如GTX 580,但是单精度计算却是遥遥领先
前几代的。
CUDA7 可以去Nvidia官网下载,配合微软的Visual Studio用。
http://developer.nvidia.com/cuda-downloads
PGI有集成Visual Studio或者分离的 带有CUDA加速的工作站系统。
http://www.pgroup.com/support/trial.htm
http://www.pgroup.com/support/download_pgi2015.php?view=current |
j*y 发帖数: 320 | 2 I prefer i7-5820k + 32GB + GTX 980ti
以前考虑过笔记本移动工作站,例如Thinkpad W540 W550, 后来完全放弃了。现在的异
构计算主要性能都是在显卡或者计算加速卡上,笔记本的显卡受功耗的限制,跟台式机
的显卡不可同日而语。所以,笔记本就应该是笔记本,轻薄够用就好。 |
n*********u 发帖数: 1030 | 3 弱弱的问一句为什么不用新一点的970而用780? |
j*y 发帖数: 320 | 4 打错了,我当时想的是980Ti。不知道怎么就打成780了。
【在 n*********u 的大作中提到】 : 弱弱的问一句为什么不用新一点的970而用780?
|
t*****z 发帖数: 1598 | 5 这文章写得很有见地。
Xeon
【在 j*y 的大作中提到】 : 如果是需要较大内存但是对整体计算性能要求不大,主要是一些服务器的应用, : 一般建议淘个二手的Xeon的带大内存的服务器或者工作站,很多公司升级机器会淘汰一 : 些前代的Xeon系统,不带OS。没关系,对华人而言自己装个OS不是难事。 : 如果对计算性能有要求,可以配一张Tesla计算卡或者Xeon Phi卡。前一些时候,Xeon : Phi卡很便宜,$150-$300能搞定,但是就是没有散热,如果自己能DIY水冷散热系统, : 无疑还是很强大的。Nvidia 的Tesla则比较贵。如果你用的CPU不是Xeon系统,对ECC校 : 验不是那么追求,可以有相对廉价的替代方案,那就是用GTX titan卡。现在很多打游 : 戏的升级显卡,淘张便宜的二手GTX titan卡做计算还是蛮实用的,titan卡自己带有散 : 热装置,不必自己另配,也算省了很多事情。不管Tesla计算卡、Xeon Phi卡还是GTX : titan卡,都是双精度计算 1 TFlops量级的。如果这个量级的计算性能还不能满足你的
|
l*******m 发帖数: 1096 | 6 i7-5820k PCI 是阉割的
Xeon
【在 j*y 的大作中提到】 : 如果是需要较大内存但是对整体计算性能要求不大,主要是一些服务器的应用, : 一般建议淘个二手的Xeon的带大内存的服务器或者工作站,很多公司升级机器会淘汰一 : 些前代的Xeon系统,不带OS。没关系,对华人而言自己装个OS不是难事。 : 如果对计算性能有要求,可以配一张Tesla计算卡或者Xeon Phi卡。前一些时候,Xeon : Phi卡很便宜,$150-$300能搞定,但是就是没有散热,如果自己能DIY水冷散热系统, : 无疑还是很强大的。Nvidia 的Tesla则比较贵。如果你用的CPU不是Xeon系统,对ECC校 : 验不是那么追求,可以有相对廉价的替代方案,那就是用GTX titan卡。现在很多打游 : 戏的升级显卡,淘张便宜的二手GTX titan卡做计算还是蛮实用的,titan卡自己带有散 : 热装置,不必自己另配,也算省了很多事情。不管Tesla计算卡、Xeon Phi卡还是GTX : titan卡,都是双精度计算 1 TFlops量级的。如果这个量级的计算性能还不能满足你的
|
w********6 发帖数: 12977 | 7 如果不玩游戏,不做大量视频处理,仅仅一般应用,少量计算,比如Mathmatica 和 一
些 numerical, 自己组装好像不合算,不如去 dell, lenovo outlet |
j*y 发帖数: 320 | 8 http://www.expreview.com/35534.html
不玩4路显卡,影响不大。
【在 l*******m 的大作中提到】 : i7-5820k PCI 是阉割的 : : Xeon
|
r**z 发帖数: 35 | 9 大牛,问一下,如果需要从外部获取1.5Gb/s的数据,流媒体3D图像合成,应该用什么
可靠的办法(或者是什么I/O卡?)读入到计算卡的内存中?
Xeon
【在 j*y 的大作中提到】 : 如果是需要较大内存但是对整体计算性能要求不大,主要是一些服务器的应用, : 一般建议淘个二手的Xeon的带大内存的服务器或者工作站,很多公司升级机器会淘汰一 : 些前代的Xeon系统,不带OS。没关系,对华人而言自己装个OS不是难事。 : 如果对计算性能有要求,可以配一张Tesla计算卡或者Xeon Phi卡。前一些时候,Xeon : Phi卡很便宜,$150-$300能搞定,但是就是没有散热,如果自己能DIY水冷散热系统, : 无疑还是很强大的。Nvidia 的Tesla则比较贵。如果你用的CPU不是Xeon系统,对ECC校 : 验不是那么追求,可以有相对廉价的替代方案,那就是用GTX titan卡。现在很多打游 : 戏的升级显卡,淘张便宜的二手GTX titan卡做计算还是蛮实用的,titan卡自己带有散 : 热装置,不必自己另配,也算省了很多事情。不管Tesla计算卡、Xeon Phi卡还是GTX : titan卡,都是双精度计算 1 TFlops量级的。如果这个量级的计算性能还不能满足你的
|
f****d 发帖数: 3217 | 10 膜拜土豪
【在 j*y 的大作中提到】 : I prefer i7-5820k + 32GB + GTX 980ti : 以前考虑过笔记本移动工作站,例如Thinkpad W540 W550, 后来完全放弃了。现在的异 : 构计算主要性能都是在显卡或者计算加速卡上,笔记本的显卡受功耗的限制,跟台式机 : 的显卡不可同日而语。所以,笔记本就应该是笔记本,轻薄够用就好。
|
|
|
n***t 发帖数: 8357 | 11 16GB RAM is more than enough to me. |
E***e 发帖数: 3430 | 12 CUDA和Phi都只适合向量化的运算吧。如果相关性没法分解,也就不能向量化,那CUDA
和Phi就都没用了。
Xeon
【在 j*y 的大作中提到】 : 如果是需要较大内存但是对整体计算性能要求不大,主要是一些服务器的应用, : 一般建议淘个二手的Xeon的带大内存的服务器或者工作站,很多公司升级机器会淘汰一 : 些前代的Xeon系统,不带OS。没关系,对华人而言自己装个OS不是难事。 : 如果对计算性能有要求,可以配一张Tesla计算卡或者Xeon Phi卡。前一些时候,Xeon : Phi卡很便宜,$150-$300能搞定,但是就是没有散热,如果自己能DIY水冷散热系统, : 无疑还是很强大的。Nvidia 的Tesla则比较贵。如果你用的CPU不是Xeon系统,对ECC校 : 验不是那么追求,可以有相对廉价的替代方案,那就是用GTX titan卡。现在很多打游 : 戏的升级显卡,淘张便宜的二手GTX titan卡做计算还是蛮实用的,titan卡自己带有散 : 热装置,不必自己另配,也算省了很多事情。不管Tesla计算卡、Xeon Phi卡还是GTX : titan卡,都是双精度计算 1 TFlops量级的。如果这个量级的计算性能还不能满足你的
|
j*y 发帖数: 320 | 13 现在程序不能分解成并行的计算,多半是写程序的算法有问题。
CUDA
【在 E***e 的大作中提到】 : CUDA和Phi都只适合向量化的运算吧。如果相关性没法分解,也就不能向量化,那CUDA : 和Phi就都没用了。 : : Xeon
|
E***e 发帖数: 3430 | 14 不要这么绝对吧
很多应用要 bootstrapping 的
【在 j*y 的大作中提到】 : 现在程序不能分解成并行的计算,多半是写程序的算法有问题。 : : CUDA
|
j*y 发帖数: 320 | 15 prefer不代表我实际中会这么配机器。主要看用途。
【在 f****d 的大作中提到】 : 膜拜土豪
|
t*****z 发帖数: 1598 | 16 Bayesian Inference也不能并行,因为后一步输入依赖前一步输出。
【在 j*y 的大作中提到】 : 现在程序不能分解成并行的计算,多半是写程序的算法有问题。 : : CUDA
|
w********6 发帖数: 12977 | 17 you can if you use Monte Carlo simulation
【在 t*****z 的大作中提到】 : Bayesian Inference也不能并行,因为后一步输入依赖前一步输出。
|
t*****z 发帖数: 1598 | 18 我的就是啊。
【在 w********6 的大作中提到】 : you can if you use Monte Carlo simulation
|
V**0 发帖数: 889 | 19 看并行到啥级别,likelhood那一步其实可以,这就已经很厉害了
当然,总体大的步骤而言MCMC是串行的
【在 t*****z 的大作中提到】 : Bayesian Inference也不能并行,因为后一步输入依赖前一步输出。
|
q*p 发帖数: 963 | 20 不知道为什么NVidia最近不怎么追求双精度FP64计算能力了。
倒是很推FP32和FP16. |
|
|
q*p 发帖数: 963 | 21 其实配机器主要看预算,有多少钱就配多少钱的机器。 |
m*****n 发帖数: 3644 | 22 现在配1万刀的(双路 E5 2687 W v2/V3),1年后2000-3000刀了。这款CPU马上就要爆
降了。 |
t*****z 发帖数: 1598 | 23 这预测有何根据?
【在 m*****n 的大作中提到】 : 现在配1万刀的(双路 E5 2687 W v2/V3),1年后2000-3000刀了。这款CPU马上就要爆 : 降了。
|
m*****n 发帖数: 3644 | 24 2687W v2大致对应于上个平台的X5690。一个2011年发布,一个2013年发布
上市后不久价格大致都是2000元一枚维持了很长时间。X5690去年上半年开始降到1000
以下,接着下半年到今年年初降到200出头。按发布日期算,2687W V2比5690再推两年
,也就是明年,应该暴降了。这是其一。
其二是,现在skylake是今年下半年发布,其服务器版本可能还要晚点。这时候2687还
是比较贵,但应该1000以内了。skylake服务器版本中的高频版,也就是2687W v2的下
一任,再要晚点,也许就是2016年下半年吧。那个时候,2687 W V2就是今天的X 5690
啦。就算newegg上价格还要1000,ebay上的二手估计300左右就能拿下。 |
t*****z 发帖数: 1598 | 25 可是,现在连v1都没怎么降呢。
[发表自未名空间手机版 - m.mitbbs.com]
【在 m*****n 的大作中提到】 : 现在配1万刀的(双路 E5 2687 W v2/V3),1年后2000-3000刀了。这款CPU马上就要爆 : 降了。
|
t*****z 发帖数: 1598 | 26 我珍藏着一块X79主板,等E5-1680v2降价了就去入一颗,组成八核能超频的终极X79平
台。
1000
5690
[发表自未名空间手机版 - m.mitbbs.com]
【在 m*****n 的大作中提到】 : 2687W v2大致对应于上个平台的X5690。一个2011年发布,一个2013年发布 : 上市后不久价格大致都是2000元一枚维持了很长时间。X5690去年上半年开始降到1000 : 以下,接着下半年到今年年初降到200出头。按发布日期算,2687W V2比5690再推两年 : ,也就是明年,应该暴降了。这是其一。 : 其二是,现在skylake是今年下半年发布,其服务器版本可能还要晚点。这时候2687还 : 是比较贵,但应该1000以内了。skylake服务器版本中的高频版,也就是2687W v2的下 : 一任,再要晚点,也许就是2016年下半年吧。那个时候,2687 W V2就是今天的X 5690 : 啦。就算newegg上价格还要1000,ebay上的二手估计300左右就能拿下。
|
m*****n 发帖数: 3644 | 27 我也不知道...
v1,v2,v3价格都差不多,1500-2000多的样子。看定位,还是一个级别 |
t*****z 发帖数: 1598 | 28 Xeon E5-2687W v1/2/3和Xeon X5687的定位才是一样的,而跟X5690一个级别的应该是
E5-2690系列。至于后来的2967v2、2699v3是新增的高端系列。
【在 m*****n 的大作中提到】 : 我也不知道... : v1,v2,v3价格都差不多,1500-2000多的样子。看定位,还是一个级别
|
m*****n 发帖数: 3644 | 29 嗯嗯,对对。
不过现在5687和5690就差几十元了
【在 t*****z 的大作中提到】 : Xeon E5-2687W v1/2/3和Xeon X5687的定位才是一样的,而跟X5690一个级别的应该是 : E5-2690系列。至于后来的2967v2、2699v3是新增的高端系列。
|
t*****z 发帖数: 1598 | 30 我想,考虑到整个平台的价格,5690当是更有吸引力的选项,5680也不错,因为便宜很
多。现在连图拉丁吧的垃圾佬,配双路1366都用5690了。
【在 m*****n 的大作中提到】 : 嗯嗯,对对。 : 不过现在5687和5690就差几十元了
|
|
|
m*****n 发帖数: 3644 | 31 等2687/2667 v2降到1500以内,我跳一台。
GPU没那么理想。
网上copy的:
就双精度浮点运算(FLOPs)来说,Xeon Phi理论上可达到3倍于Xeon E5处理器的计算
性能。然而在我们使用蒙特卡洛市场模型模拟银行间同业拆息的运算中,测试结果并未
十分理想。数据显示,MIC在性能方面表现并未明显优于Sandy Bridge。如果使用同一
程度的优化,MIC在多数设置下的运算速度都要慢于Sandy Bridge;虽然更宽的单指令
多数据流(SIMD)有益于MIC的运行,但仍不能达到英特尔Xeon E5处理器的速度。并且
,获得相近效能所需的MIC在价钱上也高于Sandy Bridge。 |
q*p 发帖数: 963 | 32 蒙特卡洛 Xeon phi不如NV CUDA好使。
目前计算加速卡,还是Tesla效率高些。
【在 m*****n 的大作中提到】 : 等2687/2667 v2降到1500以内,我跳一台。 : GPU没那么理想。 : 网上copy的: : 就双精度浮点运算(FLOPs)来说,Xeon Phi理论上可达到3倍于Xeon E5处理器的计算 : 性能。然而在我们使用蒙特卡洛市场模型模拟银行间同业拆息的运算中,测试结果并未 : 十分理想。数据显示,MIC在性能方面表现并未明显优于Sandy Bridge。如果使用同一 : 程度的优化,MIC在多数设置下的运算速度都要慢于Sandy Bridge;虽然更宽的单指令 : 多数据流(SIMD)有益于MIC的运行,但仍不能达到英特尔Xeon E5处理器的速度。并且 : ,获得相近效能所需的MIC在价钱上也高于Sandy Bridge。
|