e***e 发帖数: 3872 | 1 【 以下文字转载自 Graphics 讨论区 】
发信人: etude (小铃铛), 信区: Graphics
标 题: CUDA FFT
发信站: BBS 未名空间站 (Sat Apr 14 11:50:57 2007), 转信
比较了一下CUDA FFT Lib和Intel Math Kernel的性能,计算2D FFT,single
precision float complex to complex, 硬件分别是8800GTS和P4 3.0G(w/ HT)
显存640M和内存1G,下表中时间单位为毫秒:
size: 256 * 256 512 * 512 1024 *1024 2048 * 2048
CUDA 9.093843 31.65965 96.12374 603.8209
9.508812 31.58298 96.13728 609.9658
8.999843 31.65233 9 |
B******m 发帖数: 2643 | 2 真没想到你是做这个的:)
【在 e***e 的大作中提到】 : 【 以下文字转载自 Graphics 讨论区 】 : 发信人: etude (小铃铛), 信区: Graphics : 标 题: CUDA FFT : 发信站: BBS 未名空间站 (Sat Apr 14 11:50:57 2007), 转信 : 比较了一下CUDA FFT Lib和Intel Math Kernel的性能,计算2D FFT,single : precision float complex to complex, 硬件分别是8800GTS和P4 3.0G(w/ HT) : 显存640M和内存1G,下表中时间单位为毫秒: : size: 256 * 256 512 * 512 1024 *1024 2048 * 2048 : CUDA 9.093843 31.65965 96.12374 603.8209 : 9.508812 31.58298 96.13728 609.9658
|
e***e 发帖数: 3872 | 3 凡是不挣钱的我都学,凡是挣钱的我都做:)
【在 B******m 的大作中提到】 : 真没想到你是做这个的:)
|
B******m 发帖数: 2643 | 4 图像处理前景好么?
【在 e***e 的大作中提到】 : 凡是不挣钱的我都学,凡是挣钱的我都做:)
|
e**c 发帖数: 195 | 5 这个CUDA是什么东东?
为什么它家的2-D FFT比INTEL的要快那么多?都是硬件(并行CACHE)的功劳吗?
【在 e***e 的大作中提到】 : 凡是不挣钱的我都学,凡是挣钱的我都做:)
|
B******m 发帖数: 2643 | 6 nvidia家的专用图像处理架构,当然比Intel快。
GPU里面都是硬件实现长乘法的。
【在 e**c 的大作中提到】 : 这个CUDA是什么东东? : 为什么它家的2-D FFT比INTEL的要快那么多?都是硬件(并行CACHE)的功劳吗?
|
e***e 发帖数: 3872 | 7 不晓得哦,我猜还可以,至少在国内,国防、安全、医学好多应用现在
【在 B******m 的大作中提到】 : 图像处理前景好么?
|
e***e 发帖数: 3872 | 8 并行CACHE是一个方面,本身8800就有128或者96个1.3G的计算单元,而且卡上
内存到计算部分的数据宽度是128位的,内存传输速度可以到8G/s,(这个数字
是我的机器上实测的)。
不过逻辑复杂的程序就远没这么大的优势了,按CUDA的手册,分支、循环语句
很多都会被串行化的。
【在 e**c 的大作中提到】 : 这个CUDA是什么东东? : 为什么它家的2-D FFT比INTEL的要快那么多?都是硬件(并行CACHE)的功劳吗?
|