x**********d 发帖数: 693 | 1 2048x2048 grid.
Arrayfire(Visual Studio, cuda_x64) vs. Matlab(2015a) gpuarray
FFT2: Arrayfire比matlab只快大约2.5倍
矩阵乘法: Arrayfire比matlab慢10倍????
感觉不make sense啊.....
GPU配置如下
---------------------------------------------------------------
Platform: CUDA Toolkit 8, Driver: CUDA Driver Version: 8000
[0] GeForce GT 720, 1024 MB, CUDA Compute 3.5
MultiprocessorCount: 2
---------------------------------------------------------------
【Update】 应该是显卡和主板等综合原因。。另外一台笔记本上AF比Matlab有快出10-
20倍,但是矩阵乘法仍然比台机上跑matlab慢。。compiler用的vs而不是gcc可能也影
响效率。感谢各位回复! |
p***o 发帖数: 1252 | 2 GT 720是啥卡?
【在 x**********d 的大作中提到】 : 2048x2048 grid. : Arrayfire(Visual Studio, cuda_x64) vs. Matlab(2015a) gpuarray : FFT2: Arrayfire比matlab只快大约2.5倍 : 矩阵乘法: Arrayfire比matlab慢10倍???? : 感觉不make sense啊..... : GPU配置如下 : --------------------------------------------------------------- : Platform: CUDA Toolkit 8, Driver: CUDA Driver Version: 8000 : [0] GeForce GT 720, 1024 MB, CUDA Compute 3.5 : MultiprocessorCount: 2
|
x**********d 发帖数: 693 | 3 就一般卡吧,3年前的dell desktop默认配的。难道是因为MultiprocessorCount太少了
,优越性体现不出来吗?
【在 p***o 的大作中提到】 : GT 720是啥卡?
|
n******7 发帖数: 12463 | 4 超低端卡啊
【在 x**********d 的大作中提到】 : 就一般卡吧,3年前的dell desktop默认配的。难道是因为MultiprocessorCount太少了 : ,优越性体现不出来吗?
|
x**********d 发帖数: 693 | 5 ...这对计算影响大吗? I mean 同一个卡跑af和matlab...
【在 n******7 的大作中提到】 : 超低端卡啊
|
t*******e 发帖数: 1633 | 6 这种超低端卡跑的快慢意义都不大,真有需要就买个好显卡,为了这种低端卡改程序根
本犯不上,锁男的时间也是钱 |
p**********i 发帖数: 276 | 7 卡太低端,显存太小,流处理器才两个,可能限制发挥了吧。
【在 x**********d 的大作中提到】 : 2048x2048 grid. : Arrayfire(Visual Studio, cuda_x64) vs. Matlab(2015a) gpuarray : FFT2: Arrayfire比matlab只快大约2.5倍 : 矩阵乘法: Arrayfire比matlab慢10倍???? : 感觉不make sense啊..... : GPU配置如下 : --------------------------------------------------------------- : Platform: CUDA Toolkit 8, Driver: CUDA Driver Version: 8000 : [0] GeForce GT 720, 1024 MB, CUDA Compute 3.5 : MultiprocessorCount: 2
|
x**********d 发帖数: 693 | 8 本来用处也不是很大,但是最近写一个程序,一帧要跑1个多小时,调试起来太麻烦。
。。所以想上gpu,lab有workstation,但是我不太熟悉C++在linux上编程,想在自己
电脑上先试试,如果效果一般就算了。。PC有什么推荐的显卡吗?
【在 t*******e 的大作中提到】 : 这种超低端卡跑的快慢意义都不大,真有需要就买个好显卡,为了这种低端卡改程序根 : 本犯不上,锁男的时间也是钱
|
x**********d 发帖数: 693 | 9 有没有什么推荐的显卡呢?目前比较流行的都是几个处理器呢?我刚看我去年新买的笔
记本配的是GeForce GTX 960M,也只有5个MultiprocessorCount。。
【在 p**********i 的大作中提到】 : 卡太低端,显存太小,流处理器才两个,可能限制发挥了吧。
|
F***Q 发帖数: 6599 | 10
a low-end GPU can easily be slower than a capable CPU. if you are low in
budget, a 1050Ti is a minimum for running anything meaningful. 980Ti and
1080 are selling around $300-$400, they are the bang for the buck ($ per
core).
apparently, the newer the generation, the more SMs, the better.
【在 x**********d 的大作中提到】 : 有没有什么推荐的显卡呢?目前比较流行的都是几个处理器呢?我刚看我去年新买的笔 : 记本配的是GeForce GTX 960M,也只有5个MultiprocessorCount。。
|
x**********d 发帖数: 693 | 11 哦好吧,谢谢推荐。。我就是觉得很奇怪matlab竟然比af, which is a c++ wrapper
of Cuda 还快。。就矩阵乘法而言,用我目前的显卡,matlab gpuarray比cpu快30-40
倍, af下gpu和cpu基本持平 [facepalm]
【在 F***Q 的大作中提到】 : : a low-end GPU can easily be slower than a capable CPU. if you are low in : budget, a 1050Ti is a minimum for running anything meaningful. 980Ti and : 1080 are selling around $300-$400, they are the bang for the buck ($ per : core). : apparently, the newer the generation, the more SMs, the better.
|
p**********i 发帖数: 276 | 12 那你试试用cuda,直接调用cublas就可以了。看看速度有没有变化。
: 哦好吧,谢谢推荐。。我就是觉得很奇怪matlab竟然比af, which is a c
wrapper
: of Cuda 还快。。就矩阵乘法而言,用我目前的显卡,matlab gpuarray比cpu快
30-40
: 倍, af下gpu和cpu基本持平 [facepalm]
【在 x**********d 的大作中提到】 : 哦好吧,谢谢推荐。。我就是觉得很奇怪matlab竟然比af, which is a c++ wrapper : of Cuda 还快。。就矩阵乘法而言,用我目前的显卡,matlab gpuarray比cpu快30-40 : 倍, af下gpu和cpu基本持平 [facepalm]
|