p*******m 发帖数: 20761 | 1 虽然目前龙芯销售的成品芯片在性能、功耗等各方面都不尽人意,但是下一代核心将有
非常明显的进步,一举接近国际一流水平。
最近,《中国科学:信息科学》期刊刊登了下一代龙芯架构的相关论文,介绍了新产品
的具体改进与多项性能测试数据。从中我们惊讶地发现,新龙芯已经不再是过去那只丑
小鸭了。
龙芯现有的两个桌面型号分别是四核心的3A-1000和八核心的3B-1500,其内核是2006年
定型的GS464微架构。如今老旧的GS464核心已经不堪重任,各项性能指标与当前国际主
流CPU差距较大,无法适应竞争激烈的芯片市场。
为了追上国际一流水平,中科院计算所于2012年开始研制新一代龙芯架构“GS464E”。
2014年底,使用GS464E核心的首款芯片龙芯3A-1500成功流片,预计今年年底成品面世。
新一代龙芯跑分首曝:竟然干掉了i7!
相比上代产品,GS464E核心有了相当大的改进:提升分支预测效率、增加发射和重定序
队列、使用新设计的缓存方案和访存部件等。这些改进的结果是核心单线程性能大幅提
升,访存性能更是有了飞跃。
此外,GS464E还优化了多核并行的效率,并增加了硬件级的x86与ARM指令翻译模块,使
芯片可以高效率模拟运行x86和ARM平台的应用程序。
大家可以这样理解新龙芯核心的变化:部队行军作战不仅需要勇猛的士兵,还要有先进
的装备、稳定的后勤。上代龙芯架构中负责“作战”的那部分设计的很好,但与之配合
的“装备”“后勤”就比较落后。GS464E重点强化的就是后者,现在士兵有了强力武器
和充足的后勤供应,打起仗来自然如虎添翼。
核心大幅改进后,新龙芯的性能表现自然就备受期待。这次计算所慷慨地放出了多项测
试程序的对比结果,部分项目还直接找来Intel上代桌面高端处理器Core i7-3770来同
场竞技,让观众大饱眼福。
参与测试的处理器有上代四核心的龙芯3A-1000和新一代的3A-1500,主频均为1GHz。3A
-1000使用通道DDR3-667内存,3A-1500则用通道DDR3-1000;对比的Core i7-3770则使
用单通道DDR3-1333内存。
首先来看常用的SPEC CPU 2000跨平台测试集。单线程测试中3A-1500的整数性能比上代
提升了54.9%,浮点则大幅提升100.6%。
这还是使用通用GCC编译器的结果,如果未来改用针对新龙芯优化的专用编译器,预计
其优势会更大。
下图是新龙芯运行各项SPEC测试子项目时相对老产品的性能提升比例:
新一代龙芯跑分首曝:竟然干掉了i7!
然后是几项老牌的处理器运算速度测试程序:Whetstone偏重浮点运算,Dhrystone和
CoreMark是整数测试。
由于GS464E主频较低,这里对比了它与Core i7-3770的同频率等效性能。
新一代龙芯跑分首曝:竟然干掉了i7!
在这三项测试中,尚未得到编译器充分优化的龙芯竟然跑出了接近甚至超越Core i7的
同频效率。
虽然龙芯的主频远不如对手,整体性能依旧落后不少,但同频性能接近i7-3770已经证
明新架构的实力的确强悍。将来龙芯经过工艺改进和后端优化后可以实现2GHz以上的主
频,届时就可以和主流双核桌面CPU一较高下。
上代龙芯的一大软肋是访存性能,这也是GS464E重点强化的指标。我们来看实际测试的
结果如何:
新一代龙芯跑分首曝:竟然干掉了i7!
由于相关测试程序暂时无法识别GS464E的双路内存控制器,所以这里3A-1500与i7-3770
都是用单通道内存模式,频率分别为1000MHz和1333MHz。测试结果表明新龙芯的访存性
能有了数量级的飞跃,已经接近国际一流水平。
至此,访存性能不再是龙芯的主要瓶颈。
计算所对新龙芯的初步测试结果无疑是十分满意的。他们在文章中写道:
GS464E处理器核的性能比上一代处理器核产品有大幅提升,在流式访存程序上,更是获
得了超过10倍的性能提升。从程序运行效率的角度,其结果已不输于Intel Ivy Bridge
处理器。总体而言,GS464E的设计已经接近国际最先进水平,是一款国内顶尖的拥有自
主知识产权的处理器核产品。
短短几行字,自信和自豪感跃然纸上。
龙芯3A-1500只是GS464E核心的一个验证性质的版本,制造工艺仍是老旧的40nm,主频
不过1GHz。计算所计划在接下来发展28nm工艺、主频超过1.5GHZ的龙芯3A-2000,这款
芯片将正式推向市场,走进PC、服务器与Intel、AMD的处理器正面对抗。
计算所未来还将有加强浮点能力、支持超线程并改用更先进工艺的龙芯3B-2000等新品。
从市场角度来说,龙芯3A-2000即可满足绝大多数的家用、办公场景需求,可以替代运
行常见任务的x86 PC与服务器。由于龙芯平台基本不存在软硬件后门问题,更适合政府
和大型企业等敏感部门使用。
棱镜事件后,中国对自主研制的通用处理器需求愈发强烈。新一代龙芯如能顺利发展,
快速推向市场,将弥补我国关键领域缺乏性能够用的国产芯片的空白。经过十余年艰难
探索,龙芯终于要破茧成蝶了。
注:本文数据及图表引用自《龙芯GS464E处理器核架构设计》(《中国科学:信息科学
》2015年45卷4期)。 |
j****i 发帖数: 68152 | |
y*****n 发帖数: 11251 | 3 我党估计有集中组织人力打磨i7了。
【在 j****i 的大作中提到】 : 好。老将骂的凶,说明我党作对了
|
p**r 发帖数: 5853 | 4 You made my day
【在 y*****n 的大作中提到】 : 我党估计有集中组织人力打磨i7了。
|
S****s 发帖数: 11288 | |
y*****n 发帖数: 11251 | 6 @pker又可以make a day了。
【在 S****s 的大作中提到】 : 不会是打磨了I7然后超频吧
|
b****t 发帖数: 5743 | 7 " 届时就可以和主流双核桌面CPU一较高下"? 主流起码是4核8程吧。
今年年底成品面世,还在和3代i7单通道环境比,看不懂。
世。
【在 p*******m 的大作中提到】 : 虽然目前龙芯销售的成品芯片在性能、功耗等各方面都不尽人意,但是下一代核心将有 : 非常明显的进步,一举接近国际一流水平。 : 最近,《中国科学:信息科学》期刊刊登了下一代龙芯架构的相关论文,介绍了新产品 : 的具体改进与多项性能测试数据。从中我们惊讶地发现,新龙芯已经不再是过去那只丑 : 小鸭了。 : 龙芯现有的两个桌面型号分别是四核心的3A-1000和八核心的3B-1500,其内核是2006年 : 定型的GS464微架构。如今老旧的GS464核心已经不堪重任,各项性能指标与当前国际主 : 流CPU差距较大,无法适应竞争激烈的芯片市场。 : 为了追上国际一流水平,中科院计算所于2012年开始研制新一代龙芯架构“GS464E”。 : 2014年底,使用GS464E核心的首款芯片龙芯3A-1500成功流片,预计今年年底成品面世。
|
l**********d 发帖数: 377 | |
y*****n 发帖数: 11251 | 9 又看了一遍,发现了点东西,不知道算不算手脚。
i7-3770 基准频率3.4GHz, 睿频3.9GHz.
龙芯GS464E 1GHz
"由于GS464E主频较低,这里对比了它与Core i7-3770的同频率等效性能。"
所以就是GS464E击败了一个根本不曾存在的1GHz的无睿频的i7-3770.
客有为齐王画者,齐王问曰:“画孰最难者?”
客曰:“犬、马最难。”
齐王曰:“孰易者?”
客曰:“鬼魅最易。”
夫犬马,人所知也,旦暮罄于前,不可类也,故难;鬼魅无形者,不罄于前,故易之也
。 |
y**c 发帖数: 6307 | |
x****o 发帖数: 21566 | |
m********g 发帖数: 53 | |
p***y 发帖数: 637 | 13 同感
【在 y*****n 的大作中提到】 : 我党估计有集中组织人力打磨i7了。
|
r**********g 发帖数: 22734 | 14 这个很常见嘛,当年的amd 486 133就是"号称"性能堪比奔腾133.
【在 y*****n 的大作中提到】 : 又看了一遍,发现了点东西,不知道算不算手脚。 : i7-3770 基准频率3.4GHz, 睿频3.9GHz. : 龙芯GS464E 1GHz : "由于GS464E主频较低,这里对比了它与Core i7-3770的同频率等效性能。" : 所以就是GS464E击败了一个根本不曾存在的1GHz的无睿频的i7-3770. : 客有为齐王画者,齐王问曰:“画孰最难者?” : 客曰:“犬、马最难。” : 齐王曰:“孰易者?” : 客曰:“鬼魅最易。” : 夫犬马,人所知也,旦暮罄于前,不可类也,故难;鬼魅无形者,不罄于前,故易之也
|