首先就是要装这个 gputools。不能在gui里直接
install.package("gputools")
不然之后运行会报错说找不到cuda。须得在这里下了tar包
http://cran.r-project.org/web/packages/gputools/index.html
然后用这个
R CMD INSTALL --configure-args='--with-cuda-home=' gputools_.tar.gz
之后在R的gui里也能用了。
于是就按照别人给的例子做了测试,方阵乘法。上图
每个点都是经过20次计算取平均。可是为神马!为神马我的gpu比cpu慢呢…………T_T
系统:
cpu: intel core 2 duo 2.53G
gpu: nvidia GeForce 9400M, VRAM 256M
================ 咱也来闹次分割线 ================
看了别人的例子,发现人家闹到了上千次,确实按理说内存显存数据传递应该是一个瓶颈,数据量大的时候GPU运算的优势就能体现出来,于是——
每个类别重复10次取平均。在尝试n=5000时开始报错了,不知道是不是显存爆了。不知人家那例子里cpu搞了40秒是怎么弄出来的……