h*u
2 楼
我开了200个线程,按理说应该自动offload到mic上,但是计算速度没有任何变化,还
不如单线程openblas快。
用xeon phi 还需要对原程序修改吗?
不如单线程openblas快。
用xeon phi 还需要对原程序修改吗?
a*e
7 楼
我的意思是,最简单的方法就是 native mode 编译后拷贝到 mic 执行,这样基本上不
需要修改源码,但前提是编译中用到的相关库,也要有 mic native 的版本,才能链接
成功。
如果你用 offload 方式,则需要修改代码。OpenMP 有 offload 和 parallel 相关的
pragma,但有些 tricky 的地方,具体我没用过,也不知道更多了。
【在 h*******u 的大作中提到】
: -Mmic不是在native mode采用吗?
: 我原程序是x64的,就是不想改动,因为是别人维护的,现在改以后还要改。怎么才能
: 利用上mic?
: 还是我必须用lib/mic下面的库编译到native mode?但是用mic库编译不兼容怎么办?
需要修改源码,但前提是编译中用到的相关库,也要有 mic native 的版本,才能链接
成功。
如果你用 offload 方式,则需要修改代码。OpenMP 有 offload 和 parallel 相关的
pragma,但有些 tricky 的地方,具体我没用过,也不知道更多了。
【在 h*******u 的大作中提到】
: -Mmic不是在native mode采用吗?
: 我原程序是x64的,就是不想改动,因为是别人维护的,现在改以后还要改。怎么才能
: 利用上mic?
: 还是我必须用lib/mic下面的库编译到native mode?但是用mic库编译不兼容怎么办?
相关阅读
找python大牛co-founder说一道关于unbalanced树的面试题王垠水平见长活着就是折腾Emacs有没有办法把单行字体变大?请问一个Python的问题。做个类似于redfin那样的网站怎么入手?redfin 的怎么就不能回了?把windows batch放task scheduler里,一闪而过mxnet/tf的一个比较blog请教下微信红包算法,谢谢怎么练习multi-threading,平常工作都是用Java框架一道系统设计题求思路。石头剪刀布怎么设计这个client能在这里发招人的广告吗?我是马工,我就盼着公司layoff人 (转载)MacBook Pro is more powerful than NVDA GPU?请帮推荐个论坛、问答或微博客开源系统 支持推送和邮件订阅This Mysterious Chip In The iPhone 7 Could Be Key To Apple's AI Push