T****O 发帖数: 407 | 1 主要打算利用动力学模拟来试验有关蛋白分子结构的一些想法。先依靠GROMACS,因为
它完整且免费。但以后也可能用Amber,CHARMM或其他商业包。
首先就有一个软件问题,GROMAS主页上好像不待见双精度浮点数的必要性,认为单精度
足够。但想当年我用单精度算一个系统,三个月后被一句“你为什么不用双精度”打回
来,那个惨哪。哪位同学仔细验证过GROMACS单精度、长时间运行结果的可靠性没有?
初步目标是,以2fs步长跑到一微秒左右的时候,已知结构的小蛋白分子不会炸开。
操作系统用CentOS应该没问题吧?我可能先装Windows,用Prime95烤机,因为熟悉。
接下来是硬件问题。GROMACS v5 的CUDA实现看上去不错。Amber那帮人干脆就开卖自己
背书的CUDA硬件。所以作为起步,我打算入一块GTX 760 或 680,哪个更好?再推荐一
个品牌?
以上面说的计算为目的,显存多大比较合适?有没有更合适的推荐?预算上限$500左右
,所以Titan不考虑了。Amber评测C2050/C2070远不如GTX 680,也暂不考虑,除非捡到
$100的。
要是哪个同学成功编译验证了新的GROMACS-OpenCL,吱一声,我就转进R9 280X了。
还需要一些CPU/MB/RAM的建议。出于实验目的,机器配置不必太高,但又要可靠,不知
道是否非要ECC不可?不用ECC,i5/i7(with AVX)就可以了吧。或请推荐一个Xeon+MB+
ECC内存的组
合。包括上面的显卡,总开支不超过$1000比较理想,$1500封顶。因为更贵的话,我可
能愿意考虑Dell Precision,保修三年里随意整。
预先谢谢大家! |
t*****z 发帖数: 1598 | 2 楼主,你需要这个:
http://tieba.baidu.com/p/3566829668
【在 T****O 的大作中提到】 : 主要打算利用动力学模拟来试验有关蛋白分子结构的一些想法。先依靠GROMACS,因为 : 它完整且免费。但以后也可能用Amber,CHARMM或其他商业包。 : 首先就有一个软件问题,GROMAS主页上好像不待见双精度浮点数的必要性,认为单精度 : 足够。但想当年我用单精度算一个系统,三个月后被一句“你为什么不用双精度”打回 : 来,那个惨哪。哪位同学仔细验证过GROMACS单精度、长时间运行结果的可靠性没有? : 初步目标是,以2fs步长跑到一微秒左右的时候,已知结构的小蛋白分子不会炸开。 : 操作系统用CentOS应该没问题吧?我可能先装Windows,用Prime95烤机,因为熟悉。 : 接下来是硬件问题。GROMACS v5 的CUDA实现看上去不错。Amber那帮人干脆就开卖自己 : 背书的CUDA硬件。所以作为起步,我打算入一块GTX 760 或 680,哪个更好?再推荐一 : 个品牌?
|
n******7 发帖数: 12463 | 3 当年年少无知的时候用P4电脑跑了几个月的AMBER MD,结果也还好 |
E***e 发帖数: 3430 | 4 老汤
被动散热的GPU chassis怎么搞?
求个零售廉价方案
【在 t*****z 的大作中提到】 : 楼主,你需要这个: : http://tieba.baidu.com/p/3566829668
|
t*****z 发帖数: 1598 | 5 你说的被动散热是指,把那些Tesla M2090不做任何改造就插在机箱里,然后依靠机箱
风扇来给它们散热吗?
【在 E***e 的大作中提到】 : 老汤 : 被动散热的GPU chassis怎么搞? : 求个零售廉价方案
|
E***e 发帖数: 3430 | 6 有这么个意思
我现在有一个应用
对内存要求不高
感觉M2090的计算能力正合适
要是能搞个16*M2090的blade就牛叉了
这次搞GPU省了些budget
我不亲自花掉就要被白土豆拿去买macbook了
【在 t*****z 的大作中提到】 : 你说的被动散热是指,把那些Tesla M2090不做任何改造就插在机箱里,然后依靠机箱 : 风扇来给它们散热吗?
|
t*****z 发帖数: 1598 | 7 那么,你对显卡和CPU之间数据交换的速度有要求吗?我的意思是,你希望这些显卡都
插PCIex16,还是不介意它们插x1,就像矿机一样呢?
[发表自未名空间手机版 - m.mitbbs.com]
【在 E***e 的大作中提到】 : 有这么个意思 : 我现在有一个应用 : 对内存要求不高 : 感觉M2090的计算能力正合适 : 要是能搞个16*M2090的blade就牛叉了 : 这次搞GPU省了些budget : 我不亲自花掉就要被白土豆拿去买macbook了
|
E***e 发帖数: 3430 | 8 x1可能差了点
最好能x8+吧
给以后全换成k40留点空间
【在 t*****z 的大作中提到】 : 那么,你对显卡和CPU之间数据交换的速度有要求吗?我的意思是,你希望这些显卡都 : 插PCIex16,还是不介意它们插x1,就像矿机一样呢? : : [发表自未名空间手机版 - m.mitbbs.com]
|
t*****z 发帖数: 1598 | 9 这样的话,主板推荐用那种双芯片组的服务器板,比如X8DAH+,通道数够多,然后按照
矿机的路子来。
[发表自未名空间手机版 - m.mitbbs.com]
【在 E***e 的大作中提到】 : x1可能差了点 : 最好能x8+吧 : 给以后全换成k40留点空间
|
E***e 发帖数: 3430 | 10 这板子没几个槽啊?
16槽的是不是没太多选择?
【在 t*****z 的大作中提到】 : 这样的话,主板推荐用那种双芯片组的服务器板,比如X8DAH+,通道数够多,然后按照 : 矿机的路子来。 : : [发表自未名空间手机版 - m.mitbbs.com]
|
|
|
t*****z 发帖数: 1598 | 11 据我所知这世界上没有很多槽的主板,最多也就插四张双槽卡,而且还是相互挤得密不
透风的,要插更多显卡只能靠延长线实现。
要么你就上水冷,这样一张显卡甚至只需占单槽,你就可以插很多了。比方说ASUS ROG
Ares III,两个Hawaii核心,单槽。用我的H8DGi-F主板就能插六张,整整12颗Hawaii
核心。
还有,8x的槽,只要你自己用刀切开末端,就能插16x的卡了。
【在 E***e 的大作中提到】 : 这板子没几个槽啊? : 16槽的是不是没太多选择?
|
E***e 发帖数: 3430 | 12 好吧看来还是得去问问16槽的server怎么卖
ROG
Hawaii
【在 t*****z 的大作中提到】 : 据我所知这世界上没有很多槽的主板,最多也就插四张双槽卡,而且还是相互挤得密不 : 透风的,要插更多显卡只能靠延长线实现。 : 要么你就上水冷,这样一张显卡甚至只需占单槽,你就可以插很多了。比方说ASUS ROG : Ares III,两个Hawaii核心,单槽。用我的H8DGi-F主板就能插六张,整整12颗Hawaii : 核心。 : 还有,8x的槽,只要你自己用刀切开末端,就能插16x的卡了。
|
T****O 发帖数: 407 | 13 这配置得超过一万块吧。
我现在想的是拿块单精度不错且可执行双精度的GTX卡,先做一个完整的软硬配置,跑
一跑,看看单精度结果怎样。
依据的是下面这个,Amber14在不同CUDA硬件上做的评测
一块GTX 680, 23K个原子的系统,2fs步长一天可跑完90纳秒,三天后结果就比较有代
表性了。我考虑的系统原子数量比这还小,照这效率,估计每周至少能试验一个想法。
现在旧货680和760,新960都差不多两百块,单精度却强不少,估计就它了。不过EVGA
,华硕、技嘉这几个牌子哪个好点?
【在 t*****z 的大作中提到】 : 楼主,你需要这个: : http://tieba.baidu.com/p/3566829668
|
t*****z 发帖数: 1598 | 14 我看了一下这图表,觉得奇怪的是,两张卡的性能远不到一张卡的两倍。这说明各GPU
之间的数据传递是个瓶颈。因此,应该优先考虑少数大卡。现在性价比最高的单精度
CUDA卡应该是二手GTX 780 Ti(5046Gflops)。至于9xx系列,似乎都不高,比如980也
只有4612Gflops。
可惜不能跑OpenCL,否则R9 290X的性价比更高。
EVGA
【在 T****O 的大作中提到】 : 这配置得超过一万块吧。 : 我现在想的是拿块单精度不错且可执行双精度的GTX卡,先做一个完整的软硬配置,跑 : 一跑,看看单精度结果怎样。 : 依据的是下面这个,Amber14在不同CUDA硬件上做的评测 : 一块GTX 680, 23K个原子的系统,2fs步长一天可跑完90纳秒,三天后结果就比较有代 : 表性了。我考虑的系统原子数量比这还小,照这效率,估计每周至少能试验一个想法。 : 现在旧货680和760,新960都差不多两百块,单精度却强不少,估计就它了。不过EVGA : ,华硕、技嘉这几个牌子哪个好点?
|
E***e 发帖数: 3430 | 15 双精度小内存的最强卡现在是哪些?
GPU
【在 t*****z 的大作中提到】 : 我看了一下这图表,觉得奇怪的是,两张卡的性能远不到一张卡的两倍。这说明各GPU : 之间的数据传递是个瓶颈。因此,应该优先考虑少数大卡。现在性价比最高的单精度 : CUDA卡应该是二手GTX 780 Ti(5046Gflops)。至于9xx系列,似乎都不高,比如980也 : 只有4612Gflops。 : 可惜不能跑OpenCL,否则R9 290X的性价比更高。 : : EVGA
|
y**b 发帖数: 10166 | 16 哎,又不是你开发,只是运行别人的程序,
还是申请个超级计算机的账号吧。
现在GPU结点也很普通了。 |
T****O 发帖数: 407 | 17 我的想法试验起来算不了多久,大机器上估计半天不到。但有点bootstrapping,做完
一个才知道下一个做什么。排队的时间比算的时间恐怕都多。自己装一个合算。先搞清
楚实践上一些细节,比较好。
【在 y**b 的大作中提到】 : 哎,又不是你开发,只是运行别人的程序, : 还是申请个超级计算机的账号吧。 : 现在GPU结点也很普通了。
|