由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 核高基项目:支持国产CPU的编译系统及工具链
相关主题
这次神威1600出来,洋人有点急了这玩意基站用不上
看看国内超级计算机上都装的啥软件交部召见挪威大使抗议 国内谣言:获奖的仍是奥巴马
大家说说,四种国产CPU,谁最有前途?北京召见挪威大使抗议 国内谣言:获奖的仍是奥巴马 明报
日本人做科研的style海合会镇压巴林民运 独裁邪恶轴心伊朗严重抗议
对付中国,CPU禁运一棍子就可把中国打入深渊韩军进入紧急戒备状态请求美军加强对朝监视
Intel 2013 Haswell大一统:不再需要独立显卡美国玩石油战略和粮食战略的物质基础是虚的
哪位大拿解释一下怎么算Bit Coin要用显卡中国政府的所有智囊机构都应该立即公开发布研究成果
估计几没写过汇编靠,西媒报道政变谣言了
相关话题的讨论汇总
话题: 性能话题: 优化话题: cpu话题: 程序话题: gcc
进入Military版参与讨论
1 (共1页)
t******t
发帖数: 15246
1
“支持国产CPU的编译系统及工具链”是 国家核高基重大专项课题(课题编号
为2009ZX01036-001-002),计算所是课题牵头承担单位,联合承担单位有中科院软件
所、北京大学、同济大学、中国科技大学。2010年课题取得了如下进展:所研制的支持
国产龙芯CPU的高性能编译系统,支持多种语言,性能高于商用编译器 GCC 的 30% 以
上;所开发的二进制翻译系统,性能达到GCC所产生代码的65%,并成功地为龙芯移植了
flash播放器。另外,本项目在高性能数学库软件包、程序调试和分析工具等方面,也
已基本上完成了合同约定的指标。具体进展如下:
龙芯基本编译系统的健壮性已基本达到产品编译器的水平。主要编译选项(O0/O2/
O3/ ipa/profiling)通过了 SPECCPU 2006 测试程序,SuperTest 通过率高于
GCC 的通过率,能够支持像 GCC 4.4 和 mplayer 等实际应用
程序,支持 Java、C++ 异常处理和 OpenMP3.0。结合龙芯3号处理器的新特征,通过数
据预取、SIMD指令支持、分支指令优化等,所产生代码的定点性能比 GCC高 26
%,浮点性能高38%。完成了针对龙芯3号多核处理器的自动并行化编译功能,其并行化
后的性能加速能力,与Intel编译器的自动并行化水平相当,且对于某些程序,我们的
并行优化系统比英特尔商用编译的并行化效果更好。
二进制翻译器方面,通过采用多种优化技术,如标志位分析、非对齐优化、影子栈(
Shadow Stack)优化、动态数据预取、浮点运算异常的处理、栈变量提升,性
能得到很大提升,可达到本地性能的 65%,能够运行如 Flashplayer,Acrobat
Reader, MySQL, Apache 等应用程序。
高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5个模
块的开发工作,在X86平台上研究了性能自适应软件包的体系结构、自动性能优化技术
、核心高性能数学库子程序多核并行算法设计开发和性能优化、递归分块和非线性存储
技术、数千个数学库子程序的高效正确性组合测试等关键技术,并基于多核并行、自适
应性能优化、汇编优化、递归分块、tiling、数据结构重写等技术,对开发的数学库做
了性能优化,目前其单核平均性能是Intel公司开发的 MKL 的 1.04 倍,8 核平均性能
是 MKL 的1.24 倍。
在低功耗编译优化技术方面,提出了Profiling驱动的动态频率调节方法,在程序
中找到合适的函数区域,插入动态调频指令,实现运行时的处理器动态频率调节。测试
数据表明,该方法可以在处理器性能延迟小于5%的情况下,降低处理器能耗 10% 以上。
静态程序分析和错误检测工具方面,设计并实现了一个支持高可靠软件开发的编译
框架原型。在面向多核行为的程序静态分析技术方面,构建了精确的全程序分析框架,
开发了高效的流敏感、上下文敏感的基于程序依赖图的程序切片引擎。为用户提供了插
桩工具、并行程序集成调试系统平台,实现了程序编辑、工程管理等用户直接使用的功
能,支持宿主机与目标机之间的通信与跨平台编译、启动待调试与分析程序执行等幕后
功能。完成了第二版SMART软件和多线程应用并行行为剖析器TProfiler软件的开发,为
用户提供了一个图形化的程序性能分析工具。
S******8
发帖数: 24594
2
龙芯16核处理器性能和功耗都超越intel i-5,什么时候在美国上市啊?
h*******2
发帖数: 5093
3
快乐, 英特尔要痛苦了
软件也出来了,微软套哭死了

【在 S******8 的大作中提到】
: 龙芯16核处理器性能和功耗都超越intel i-5,什么时候在美国上市啊?
f******i
发帖数: 4647
4
搞笑

O2/

【在 t******t 的大作中提到】
: “支持国产CPU的编译系统及工具链”是 国家核高基重大专项课题(课题编号
: 为2009ZX01036-001-002),计算所是课题牵头承担单位,联合承担单位有中科院软件
: 所、北京大学、同济大学、中国科技大学。2010年课题取得了如下进展:所研制的支持
: 国产龙芯CPU的高性能编译系统,支持多种语言,性能高于商用编译器 GCC 的 30% 以
: 上;所开发的二进制翻译系统,性能达到GCC所产生代码的65%,并成功地为龙芯移植了
: flash播放器。另外,本项目在高性能数学库软件包、程序调试和分析工具等方面,也
: 已基本上完成了合同约定的指标。具体进展如下:
: 龙芯基本编译系统的健壮性已基本达到产品编译器的水平。主要编译选项(O0/O2/
: O3/ ipa/profiling)通过了 SPECCPU 2006 测试程序,SuperTest 通过率高于
: GCC 的通过率,能够支持像 GCC 4.4 和 mplayer 等实际应用

e***l
发帖数: 710
5
里面的东西大部分都是靠谱的。这些东西都是硬件软件中的根基,投入研究是完全值得
的,而且对国防领域意义重大。除了美国,世界上还有几个国家自己研发CPU?开发这
东西主要不是为商用的,你知道Intel一年投入多少钱做开发,营销?Intel的CPU销量
大所以才能把研发成本平摊下来。要直接竞争是不现实的。再说研究这东西花钱还真不
算太多。
r********n
发帖数: 7441
6
这啥意思“ 高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5
个模
块的开发工作”
把人家的现成的库拿来主义?

O2/

【在 t******t 的大作中提到】
: “支持国产CPU的编译系统及工具链”是 国家核高基重大专项课题(课题编号
: 为2009ZX01036-001-002),计算所是课题牵头承担单位,联合承担单位有中科院软件
: 所、北京大学、同济大学、中国科技大学。2010年课题取得了如下进展:所研制的支持
: 国产龙芯CPU的高性能编译系统,支持多种语言,性能高于商用编译器 GCC 的 30% 以
: 上;所开发的二进制翻译系统,性能达到GCC所产生代码的65%,并成功地为龙芯移植了
: flash播放器。另外,本项目在高性能数学库软件包、程序调试和分析工具等方面,也
: 已基本上完成了合同约定的指标。具体进展如下:
: 龙芯基本编译系统的健壮性已基本达到产品编译器的水平。主要编译选项(O0/O2/
: O3/ ipa/profiling)通过了 SPECCPU 2006 测试程序,SuperTest 通过率高于
: GCC 的通过率,能够支持像 GCC 4.4 和 mplayer 等实际应用

c**********w
发帖数: 1746
7
gcc不是商用吧
O2的程序,intel的编译器一般比gnu的快一半以上,有些code接近快一倍
不过这些东西的确要搞,不仅要搞,还需要搞出自己的特色,跟在别人屁股后面是跟不
上的
c**********w
发帖数: 1746
8
这些东西都是open source的嘛,自己再去写一遍确实意义不大,写出来也差不多

器5

【在 r********n 的大作中提到】
: 这啥意思“ 高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5
: 个模
: 块的开发工作”
: 把人家的现成的库拿来主义?
:
: O2/

t******t
发帖数: 15246
9
继承和吸收人类文明的一切成果。

器5

【在 r********n 的大作中提到】
: 这啥意思“ 高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5
: 个模
: 块的开发工作”
: 把人家的现成的库拿来主义?
:
: O2/

e***l
发帖数: 710
10
另外这种基础研究成果出的慢,需要长时间的积累,短期的成果可能看起来不那么让人
信服,但是又不得不宣传一些东西来争取国家的投入。开发国产CPU,不是专门给你跑
windows玩游戏看电影的,不要拿商用处理器的标准来比较。
相关主题
Intel 2013 Haswell大一统:不再需要独立显卡这玩意基站用不上
哪位大拿解释一下怎么算Bit Coin要用显卡交部召见挪威大使抗议 国内谣言:获奖的仍是奥巴马
估计几没写过汇编北京召见挪威大使抗议 国内谣言:获奖的仍是奥巴马 明报
进入Military版参与讨论
s*****r
发帖数: 43070
11
不要抱太大的希望,软件必须靠公司,大学做出来的软件,大家都知道是怎么回事。

器5

【在 r********n 的大作中提到】
: 这啥意思“ 高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5
: 个模
: 块的开发工作”
: 把人家的现成的库拿来主义?
:
: O2/

e***l
发帖数: 710
12

这都是有标准的,实现BLAS库就是要能提供和BLAS库一样的计算。不然那些运行在这些
库上的软件都没法跑了。

【在 s*****r 的大作中提到】
: 不要抱太大的希望,软件必须靠公司,大学做出来的软件,大家都知道是怎么回事。
:
: 器5

r********n
发帖数: 7441
13
我十分怀疑现在的水平之上再搞编译器优化能够有多大收效

【在 c**********w 的大作中提到】
: gcc不是商用吧
: O2的程序,intel的编译器一般比gnu的快一半以上,有些code接近快一倍
: 不过这些东西的确要搞,不仅要搞,还需要搞出自己的特色,跟在别人屁股后面是跟不
: 上的

s*****r
发帖数: 43070
14
现在硬件这么牛,编译器没以前那么重要了,
最重要的还是操作系统和数据库,这两个搞不出来,其他软件都意义。

【在 c**********w 的大作中提到】
: gcc不是商用吧
: O2的程序,intel的编译器一般比gnu的快一半以上,有些code接近快一倍
: 不过这些东西的确要搞,不仅要搞,还需要搞出自己的特色,跟在别人屁股后面是跟不
: 上的

e***l
发帖数: 710
15

器5
我不知道这里具体指重写库还是做优化。那些库都是存在几十年了,基本算法层面很难
有改进,但是实现细节可以不同,特别是在多核平台上。AMD和INTEL都有针对自己CPU
的数学库。如果是做优化,优化它们就相当于提升了宣传的计算能力,因为评测CPU计
算能力就是那一些库去跑benchmark。

【在 r********n 的大作中提到】
: 这啥意思“ 高性能数学库方面已完成 BLAS、LAPACK、FFT、直接解法器和迭代解法器5
: 个模
: 块的开发工作”
: 把人家的现成的库拿来主义?
:
: O2/

r********n
发帖数: 7441
16
这个不一样,大学出的是以低廉的成本支撑起战略性的新的思路和方向,一般的公司没
有财力去支撑长期不赢利的研发,除了IBM和ATT这样的公司外,我觉得硅谷的模式不错
,大学里面的教授和学生搞原型,借助angel capital的孵化器来市场化,最后走上市
和并购的路线,经过这么几轮下来,凡是幸存下来的都是好产品
09年的时候ILog(目前最成功的线型规划软件)3.4亿卖给了IBM,我觉得IBM赚大发了

【在 s*****r 的大作中提到】
: 不要抱太大的希望,软件必须靠公司,大学做出来的软件,大家都知道是怎么回事。
:
: 器5

r********n
发帖数: 7441
17
现在很多行业一天的交易量就达到TB量级,象mysql这样的传统数据库已经不行了,就
跟toy一样,我觉得提供廉价并行计算服务的公司会越来越火,google和yahoo还能够火
一阵子

【在 s*****r 的大作中提到】
: 现在硬件这么牛,编译器没以前那么重要了,
: 最重要的还是操作系统和数据库,这两个搞不出来,其他软件都意义。

s*****r
发帖数: 43070
18
硅谷当然好,不然也不叫硅谷,问题是中国有专门搞基础软件的企业吗?小打小闹成不
了气候。
俺觉得中国软件毁在盗版上了,当时觉得是占便宜,现在想追回来,太难了。

【在 r********n 的大作中提到】
: 这个不一样,大学出的是以低廉的成本支撑起战略性的新的思路和方向,一般的公司没
: 有财力去支撑长期不赢利的研发,除了IBM和ATT这样的公司外,我觉得硅谷的模式不错
: ,大学里面的教授和学生搞原型,借助angel capital的孵化器来市场化,最后走上市
: 和并购的路线,经过这么几轮下来,凡是幸存下来的都是好产品
: 09年的时候ILog(目前最成功的线型规划软件)3.4亿卖给了IBM,我觉得IBM赚大发了

r********n
发帖数: 7441
19
话是这么说,记得以前看BLAS和LAPACK的源代码,貌似它们的库函数里很多容错处理都
没有,感觉就是简单实现一下课本中的算法,真正商业化,确实得加很多判断,除非预
处理做的比较牛

CPU

【在 e***l 的大作中提到】
:
: 器5
: 我不知道这里具体指重写库还是做优化。那些库都是存在几十年了,基本算法层面很难
: 有改进,但是实现细节可以不同,特别是在多核平台上。AMD和INTEL都有针对自己CPU
: 的数学库。如果是做优化,优化它们就相当于提升了宣传的计算能力,因为评测CPU计
: 算能力就是那一些库去跑benchmark。

G*****h
发帖数: 33134
20
就算盗版,也是盗的国外软件多
国内软件盗版都没人用

【在 s*****r 的大作中提到】
: 硅谷当然好,不然也不叫硅谷,问题是中国有专门搞基础软件的企业吗?小打小闹成不
: 了气候。
: 俺觉得中国软件毁在盗版上了,当时觉得是占便宜,现在想追回来,太难了。

相关主题
海合会镇压巴林民运 独裁邪恶轴心伊朗严重抗议中国政府的所有智囊机构都应该立即公开发布研究成果
韩军进入紧急戒备状态请求美军加强对朝监视靠,西媒报道政变谣言了
美国玩石油战略和粮食战略的物质基础是虚的人人上有人写的志愿者。。。第三段看的好痛心。。。。。
进入Military版参与讨论
s*****r
发帖数: 43070
21
这些行业应该是IBM和Oracle的天下,完全是坐着收钱,养一大批闲人。
Google搞的东西跟交易行业没啥交集。

【在 r********n 的大作中提到】
: 现在很多行业一天的交易量就达到TB量级,象mysql这样的传统数据库已经不行了,就
: 跟toy一样,我觉得提供廉价并行计算服务的公司会越来越火,google和yahoo还能够火
: 一阵子

r********n
发帖数: 7441
22
国内牛b一点的实验室来钱太容易,我们原来一个实验室的老板,他带着学生搞研发,
他儿子在外面做实用化推广,看着很朴素,但是身价都是几千万的,这样的条件下,根
本不可能有耐心搞基础研发,中国的基础研发只能在艰苦条件下搞

【在 s*****r 的大作中提到】
: 硅谷当然好,不然也不叫硅谷,问题是中国有专门搞基础软件的企业吗?小打小闹成不
: 了气候。
: 俺觉得中国软件毁在盗版上了,当时觉得是占便宜,现在想追回来,太难了。

s*****r
发帖数: 43070
23
估计就是数据库应用,其实国外类似软件很多,专门面向企业,又全面又好用,就是欺
负国内企业没见过世面。

【在 r********n 的大作中提到】
: 国内牛b一点的实验室来钱太容易,我们原来一个实验室的老板,他带着学生搞研发,
: 他儿子在外面做实用化推广,看着很朴素,但是身价都是几千万的,这样的条件下,根
: 本不可能有耐心搞基础研发,中国的基础研发只能在艰苦条件下搞

e***l
发帖数: 710
24
龙芯+Linux+开源软件,只要在国防机构和科研院校普及起来了,我觉得就上正道了。
1 (共1页)
进入Military版参与讨论
相关主题
靠,西媒报道政变谣言了对付中国,CPU禁运一棍子就可把中国打入深渊
人人上有人写的志愿者。。。第三段看的好痛心。。。。。Intel 2013 Haswell大一统:不再需要独立显卡
约翰·桑希尔:中国转型将影响未来十年全球经济哪位大拿解释一下怎么算Bit Coin要用显卡
科研原创贡献老外比谁都算得清楚(图)估计几没写过汇编
这次神威1600出来,洋人有点急了这玩意基站用不上
看看国内超级计算机上都装的啥软件交部召见挪威大使抗议 国内谣言:获奖的仍是奥巴马
大家说说,四种国产CPU,谁最有前途?北京召见挪威大使抗议 国内谣言:获奖的仍是奥巴马 明报
日本人做科研的style海合会镇压巴林民运 独裁邪恶轴心伊朗严重抗议
相关话题的讨论汇总
话题: 性能话题: 优化话题: cpu话题: 程序话题: gcc