p******e 发帖数: 528 | 1 我知道ECC内存原则上要比一般内存更稳定,而且错误要少。但是我想知道是不是
对于科学计算,我们必须得用ECC内存。换句话说,如果不用ECC内存,会不会说
计算出了错误,而我根本就没法察觉出来呢?
我之所以会有这个问题,是想知道非ECC内存究竟有多不稳定?或者说非ECC内存
会不会产生不可察觉的计算错误。比方说我在一个有ECC内存的服务器上进行计算。
然后把这个结果下载并显示在自己的笔记本上。由于我的笔记本没有ECC内存,
会不会导致在笔记本上的信息产生随机的错误呢?要是非ECC内存真的这么不稳定,
岂不是说我在这个技术的每个环节上都得用服务器才行了吗? |
|
M********y 发帖数: 1964 | 2 ECC需要主板支持,不是slot的原因。
是ECC的,老的是non-ECC。DDR2 240 pin ECC和non-ECC不兼容? |
|
N******2 发帖数: 436 | 3 刚读了Desktop Engineering上面介绍的Xeon, ECC内存和i7的区别,现学现卖。
Xeon可以接ECC内存,i7不行。
ECC内存的优势是多一个额外的bit,可以通过奇偶校验来矫正很多内存错误。现在的内
存芯片都是由很小的一个个电容上的电压来表示0或者1,这些电容一是会漏电,所以需
要动态刷新,二是有可能受外界的电磁干扰,或者背景宇宙辐射的影响而发生错误。
ECC能够矫正大概99.9998%的错误。Google发现平均每个内存条每年有3751个ECC可以纠
正的错误。
此外,Xeon比i7可以有更多的核,更高的可靠性,更好的数据完整性性能,更大的缓存
,更多的内存带宽,和很多专业软件都对Xeon进行了优化和提供专业认证。
对于银行,长达几天几个月的模型模拟公司来说,可靠,不出错是他们选择Xeon的原因
。这也是为什么工作站和服务器基本上都选用Xeon和ECC内存。
i7基本上就是普通用户用的。 |
|
l*****e 发帖数: 227 | 4 如果ECC和Non-ECC内存混用,ECC将失效。
请问如果Non-ECC内存和Xeon混用,Xeon的ECC等纠错功能还会有效吗?
另外registered,unbuffered这些区别很大吗?
想作电路模拟,TCAD simulation ECC内存是否很关键? |
|
N******7 发帖数: 1297 | 5 找了几条2g的ddr2内存想换上,怎么也装不上。比了半天,slot不一样?一看找来的是ECC的,老的是non-ECC。DDR2 240 pin ECC和non-ECC不兼容? |
|
d***a 发帖数: 13752 | 6 ECC内存不贵,能用ECC内存的Xeon处理器贵。实际上,要让处理器支持ECC(cache和
memory)是很简单的事情,并不应该有现在这么大的差价。但现在的市场定位就是这样
,Xeon处理器的定位高,Intel可以在多赚,买服务器的公司也愿意付这个钱。
现在内存条的出错率越来越高。以后有可能,家用机的处理器也不得不用ECC。 |
|
t*****z 发帖数: 1598 | 7 但是显卡上用ECC显存只是最近的事情。尤其A卡是从Tahiti才有的事情,还只是一部分
型号。MacPro的Tahiti卡因为少了ECC就特别便宜,N家的Tesla比Titan贵这么多就是因
为ECC。这不都是炒作的例子么?以前那么多图形工作站都没有ECC,连很多超算都没有
。难道他们就不活了咩? |
|
N******2 发帖数: 436 | 8 设想一下,银行有几十万个储户的账号信息,银行的服务器在处理用户数据的时候,某
一个bit发生错误,你说会有什么样的危害?
或者一个公司在运行一个长达几个星期的模拟的时候,后面的结果依赖于前面的结果,
如果前面的结果有一个bit错误,那后面的结果就全错了。
OS没法纠正这些错误,因为电路根本就不知道自己错了。ECC内存可以通过额外的bit来
纠正大部分错误,当然很多类型的错误ECC也纠正不了,但那些错误要纠正成本太高。
所以很多银行的服务器,超级电脑都有冗余,就是两个电源,两个CPU一起运算,两个
结果比较,如果一致就接受结果,不一致就报错。
你说的那个i7服务器几个月不出错,一是可能内存出错的地方正好在OS没用到的内存地
址处,二是就算出错也不一定会系统崩溃。
但是对关键应用,为保证万无一失,都是用Xeon + ECC。 这个就跟山珍海味能填饱肚
子,清水煮地瓜叶能填饱肚子一样,看你能付多大的成本,接受多大的风险。 |
|
|
m******n 发帖数: 1691 | 9 我不认为普通内存有这么高的错误率,否则系统稳定性也太差了。
再说现在很多内存自检程序连续跑几个月也不出错。别告诉我说是因为两个内存单元
同时同一个bit出错所以比较时检查不出来啊。
设想一下,银行有几十万个储户的账号信息,银行的服务器在处理用户数据的时候,某
一个bit发生错误,你说会有什么样的危害?
或者一个公司在运行一个长达几个星期的模拟的时候,后面的结果依赖于前面的结果,
如果前面的结果有一个bit错误,那后面的结果就全错了。
OS没法纠正这些错误,因为电路根本就不知道自己错了。ECC内存可以通过额外的bit来
纠正大部分错误,当然很多类型的错误ECC也纠正不了,但那些错误要纠正成本太高。
所以很多银行的服务器,超级电脑都有冗余,就是两个电源,两个CPU一起运算,两个
结果比较,如果一致就接受结果,不一致就报错。
你说的那个i7服务器几个月不出错,一是可能内存出错的地方正好在OS没用到的内存地
址处,二是就算出错也不一定会系统崩溃。
但是对关键应用,为保证万无一失,都是用Xeon + ECC。 这个就跟山珍海味能填饱肚
子,清水煮地瓜叶能填饱肚子一样,看你能付多大的成本,接受多... 阅读全帖 |
|
D******k 发帖数: 335 | 10 有台Lenovo Thinkstation S30台式机,目前用了混搭内存:
Kingston Technology ValueRAM 8GB 1600MHz DDR3 PC3-12800 ECC Reg CL11 DIMM DR
x4 Hynix C Server Memory KVR16R11D4/8HC 和
Kingston 16GB 240-Pin DDR3 SDRAM ECC Registered DDR3 1600 Server Memory DR
x4 Model KVR16R11D4/16
想升级下内存,不知道ebay哪里卖便宜的2手8GB/16GB ECC Registered 台式机/服务器
内存?想把8个内存条都换成一样的内存条用满,机器再发挥余热几年。
谢谢! |
|
f******h 发帖数: 609 | 11 第一次投 ECCS, 请问 ECCS 11/01/2012 deadline 的program一般什么时候开始panel
啊?一般多长时间知道结果呢?
多谢! |
|
e**p 发帖数: 82 | 12 看来今天ECCS的变态是division level的了。估计是昨天最后两个ECCS的panel结束,
所有的结果已经出来了,所以今天悲剧的那些upload review comments。
过了今天还不变态的很大可能就是中了。 |
|
h********a 发帖数: 135 | 13 可以用的。。。 但是ECC功能不起效、、
且支持ECC的主板也可以用普通内存 |
|
h********a 发帖数: 135 | 14 我现在用的其中1台电脑就可以用ECC内存,主板是P965的
这个ECC内存还是比较差,用的是很垃圾的NANYA颗粒的。。。 |
|
P***a 发帖数: 4213 | 15 看主板了,如果主板支持混用,ecc会被禁掉。不支持的话,就没戏。
最好不要混用。 |
|
G**Y 发帖数: 33224 | 16 Dell的Precision工作站,是不是必须用ECC呀?ECC有啥好处呢?
好像Lenovo还是啥的的可以用一般的内存呀。 |
|
|
i**w 发帖数: 883 | 18 要么全部ECC,要么全部 non ECC,不可混用 |
|
n*****2 发帖数: 1432 | 19 不能混用而已。
我直接max out ECC 4GB *2 了。
普通服务器,再插一条2GB ECC也够用了吧。 |
|
d*a 发帖数: 1863 | 20 想买个dell workstation做计算,打算用ECC 16G内存,可是dell得太贵了,
能不能先选个小的NECC,然后自己买了内存装上去.
我记得上次我们租买的机器(T3500)不认ECC内存,难道说还要在BIOS上设置什么的么? |
|
d*a 发帖数: 1863 | 21 噢 也就是说要用ECC内存
就得在dell网站选ECC的? 难道dell还给同一型号的机器配两种主板?? |
|
|
a**u 发帖数: 492 | 23 单路的Xeon并不比i7有更多的核吧
双路多路的...本来也没有i7啥事了
另外Intel很多比i7便宜的CPU
比如i3/Pentium/Celeron倒都是支持ECC
所以看起来是各个价位上的CPU都有ECC可选
价差主要是由主板和内存来体现 |
|
c****p 发帖数: 6474 | 24 咱俩说的不是一个问题。
另外Cache带ECC比较常见。民用CPU的Register带ECC的比较少见(如果不是没有的话)
吧。 |
|
w***n 发帖数: 1613 | 25 there is ecc registered, and there is ecc unbuffered.which do you want? |
|
t*****z 发帖数: 1598 | 26 要我说啊,ECC跟机械键盘、固态硬盘、4K显示器一样,都是个噱头,炒作个概念,创
造个经济增长点,用所谓业界标准强制用户升级,并且提高准入门槛。实际上ECC没什
么技术上的必须性。看着吧,以后他们还会炒作主板框架必须用空气层稳定,否则就不
是入流的计算机,算出的结果他们不认。 |
|
p******e 发帖数: 528 | 27 其实我觉得关于ECC的讨论中有一个很重要的问题被忽略了,那就是
如果计算机的运行过程中会产生随机的错误,那么是否有研究说这个
随机的错误的主要来源是来自于内存。比方说我有一个任务经常需要在
2台计算机之间传送数据,也许在传输的过程中,在网络层面会也会
产生错误(当然这只是我的猜测。)而且假设在网络层面的错误率要
远高于内存。那么是否使用ECC内存对于我的任务的错误率影响极其
有限,那么在这种情况下也许多投资在网络设备上会对于解决错误
更为有效。 |
|
F******k 发帖数: 7375 | 28 如果是ECC+Registered DDR3就很便宜。这ECC真有用么?Lenovo TS140用。
有物廉价美的麻烦推荐一下,谢谢 |
|
|
|
p***o 发帖数: 1252 | 31 奔腾都能上ECC, i5和i7的ecc支持被阉割了而已。 |
|
w*******y 发帖数: 60932 | 32 mwave has AVEXIR AVD2U08000502G-2SW Standard series 4GB ( 2GB x 2 ) 240-pin
DDR2 800mhz non-ECC desktop memory module:
http://www.mwave.com/mwave/SKUSearch.asp?px=DS&scriteria=BA4202
for $29.99 + FS
If you have a review coupon, get it for $25 + FS
Model: AVD2U08000502G-2S
Capacity Size: 2GBx2
Bandwidth Frequency: PC2 6400 6.4GB/Sec (DDR2-800 MHz) CL5
Suitable for: Suitable for Desktop PC DDR2 Unbuffered DIMM
Module Specifications: 240 Pin Unbuffered DIMM Non-ECC JEDEC
Pin layout: 128Mb x8 DDR2... 阅读全帖 |
|
e**p 发帖数: 82 | 33 你这个是ECCS的什么program?
我CCSS的二月下panel,但是日期还是11月的。 |
|
|
|
e**p 发帖数: 82 | 36 我是指ECCS的所有panel.最后的两个昨天刚结束。有些决定应该是所有panel完后才做
的吧。 |
|
n******r 发帖数: 236 | 37 你这个分在ECCS里算很不错的,和PM多聊聊,改投regular有点可惜。 |
|
x*********o 发帖数: 75 | 38 鼓起勇気再试了一次。NSF ECCS program panel 后多久会知道结果呢? |
|
|
i**********1 发帖数: 23 | 40 两个职位,倾向PHD。 感兴趣站短。 谢谢啦~
Job Title:ECC Research Engineer
Job Description:
Develop advanced error control coding and signal processing techniques for
non-volatile memories
Requirements:
Expertise in LDPC and BCH/RS codes
Knowledge in statistical signal processing and detection
Experience in channel modeling and simulation
Good communication skills to cooperate with international cross-disciplinary
teams
Job Title:Storage software developer
Job Description:
Linux kernel de... 阅读全帖 |
|
n*******i 发帖数: 268 | 41 存储科技公司需要一位做ECC的architect,要求博士,有无经验都可,懂LDPC尤佳。
email: [email protected]
/* */ |
|
d***t 发帖数: 253 | 42 【 以下文字转载自 JobHunting 讨论区 】
发信人: doubt (doubt), 信区: JobHunting
标 题: Opening for error correction coding (ECC)/signal processing
发信站: BBS 未名空间站 (Wed May 6 01:22:04 2009)
有个朋友在招人,上市semiconductor company,要招EE的master or PhD,必须懂error correction coding,signal processing也比较重要。公司在硅谷,最好是local candidate,外地的也可以考虑。new graduate也可以申请。
我朋友是HM, 请站内联系。 |
|
a***y 发帖数: 19743 | 43 如果定一个iMac,又不支持ECC,岂不是不适合科学运算?还是应该入workstation啊。
可惜workstation不是Mac Pro的话又不能跑OS X。 |
|
d***a 发帖数: 13752 | 44 算两遍是一种通用的做法,简单有效。即使内存有ECC保护,CPU也有可能出错,算两遍
的方法,也可以检测出CPU出错。当然它的问题也很明显,要浪费一半的计算能力。 |
|
r***e 发帖数: 2539 | 45 捡了一堆 pc6400 ecc的内存,都带着很牛的散热片,
不过普通主板上不能用吧?可惜了。 |
|
r**********e 发帖数: 2821 | 46 这个很难说,有的板子插ECC的内存,即使是unregistered的,也不post。 |
|
r**********e 发帖数: 2821 | 47 俺遇到过n多不post,都是dell的机器。optiplex GX260,270....等一堆不同主板的机
器用ECC的就是点不亮。并非小概率现象。难道所有intel主板问题? |
|
t**t 发帖数: 27760 | 48 标准的工作站都是用ECC内存。
就是稳定而已。 |
|
f*****Q 发帖数: 1912 | 49 算数的都应该用ECC,内存出错的概率对于大计算还是很大的。 |
|
|