h*******u 发帖数: 15326 | 1 我开了200个线程,按理说应该自动offload到mic上,但是计算速度没有任何变化,还
不如单线程openblas快。
用xeon phi 还需要对原程序修改吗? |
a*****e 发帖数: 1700 | 2 编译的时候用 -mmic 了吗? 最简单是编译 knc binary 拷贝到卡上然后运行。
如果你用 offload 模式,至少需要修改源码加入几个 pragma
【在 h*******u 的大作中提到】 : 我开了200个线程,按理说应该自动offload到mic上,但是计算速度没有任何变化,还 : 不如单线程openblas快。 : 用xeon phi 还需要对原程序修改吗?
|
h*******u 发帖数: 15326 | 3 -Mmic不是在native mode采用吗?
我原程序是x64的,就是不想改动,因为是别人维护的,现在改以后还要改。怎么才能
利用上mic?
还是我必须用lib/mic下面的库编译到native mode?但是用mic库编译不兼容怎么办?
【在 a*****e 的大作中提到】 : 编译的时候用 -mmic 了吗? 最简单是编译 knc binary 拷贝到卡上然后运行。 : 如果你用 offload 模式,至少需要修改源码加入几个 pragma
|
a*****e 发帖数: 1700 | 4 我的意思是,最简单的方法就是 native mode 编译后拷贝到 mic 执行,这样基本上不
需要修改源码,但前提是编译中用到的相关库,也要有 mic native 的版本,才能链接
成功。
如果你用 offload 方式,则需要修改代码。OpenMP 有 offload 和 parallel 相关的
pragma,但有些 tricky 的地方,具体我没用过,也不知道更多了。
【在 h*******u 的大作中提到】 : -Mmic不是在native mode采用吗? : 我原程序是x64的,就是不想改动,因为是别人维护的,现在改以后还要改。怎么才能 : 利用上mic? : 还是我必须用lib/mic下面的库编译到native mode?但是用mic库编译不兼容怎么办?
|