e***e 发帖数: 3872 | 1 【 以下文字转载自 Graphics 讨论区 】
发信人: etude (小铃铛), 信区: Graphics
标 题: CUDA FFT
发信站: BBS 未名空间站 (Sat Apr 14 11:50:57 2007), 转信
比较了一下CUDA FFT Lib和Intel Math Kernel的性能,计算2D FFT,single
precision float complex to complex, 硬件分别是8800GTS和P4 3.0G(w/ HT)
显存640M和内存1G,下表中时间单位为毫秒:
size: 256 * 256 512 * 512 1024 *1024 2048 * 2048
CUDA 9.093843 31.65965 96.12374 603.8209
9.508812 31.58298 96.13728 609.9658
8.999843 31.65233 9 |
|