1.原因

只有一块amd显卡rx580,最近显卡又贵,不想换,想着便宜了买块新1660

2.准备

首先要准备ubuntu系统,去官网下载,百度搜ubuntu就是。
一开始我总是把ubuntu写成ubantu,没发现搜错。
之后准备安装双系统,这是按照他人的文章一步步作的。
后来重装了很多次,发现ubuntu安装分区时不需要那么麻烦,记住分‘/’,‘/home’,‘/snap’和启动项就行了。

3.ubuntu20系统问题

我第一次装完系统,发现software-center打不开,也无法使用软件安装,安装这篇文章的方法操作了下,至少能安装软件了
毕竟萌新,命令行安装还是麻烦
后来rocm卸载后在安装总是有依赖问题无法安装部分包,放弃了,再次重装系统,就没有software的问题了,玄学

4.安装rocm问题

安装官网文件
https://rocmdocs.amd.com/en/latest/Installation_Guide/Installation-Guide.html
一步步安装,
有发现一个问题,应该是两个

/opt/rocm/bin/rocminfo
/opt/rocm/opencl/bin/clinfo

这一部总是无法正常 显示gpu,根据百度翻译,确认两个问题
这是当时的截图,无法找到gpu信息
1.对/dev/kfd文件无权限,
搜索permission denied查到文章
ubuntu下使用filezilla上传文件权限问题(open for write: permission denied).
使用

// An highlighted block
sudo chmod 777 /dev/kfd

获取权限

另外需要将用户加入render组
好多安装rocm都没有提到这个问题,一般都加入video组就下一步了

加入render组后可以正常显示gpu信息了

5.安装tensorflow-rocm

至今没明白一个问题
tensorflow 是cpu版本
tensorflow-gpu是nivda版本
tensorflow-rocm是amd显卡版本是吗?

这一部依旧安装官方文档:Tensorflow安装.

现在又遇到一个问题,系统中python3 可以调用tensorflow,但pycharm无tensorflow,一会重启试一下。
系统中完好
测试tensorflow能否使用gpu;

import tensorflow as tf
tf.config.list_physical_devices('GPU')

结果

2021-04-10 14:10:07.680782: I tensorflow/compiler/jit/xla_cpu_device.cc:41] Not creating XLA devices, tf_xla_enable_xla_devices not set
2021-04-10 14:10:07.681037: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library libamdhip64.so
2021-04-10 14:10:07.725922: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1734] Found device 0 with properties: 
pciBusID: 0000:29:00.0 name: Ellesmere [Radeon RX 470/480/570/570X/580/580X/590]     ROCm AMDGPU Arch: gfx803
coreClock: 1.34GHz coreCount: 36 deviceMemorySize: 8.00GiB deviceMemoryBandwidth: 119.21GiB/s
2021-04-10 14:10:07.728730: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library librocblas.so
2021-04-10 14:10:07.729808: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library libMIOpen.so
2021-04-10 14:10:07.744546: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library libhipfft.so
"hipErrorNoBinaryForGpu: Unable to find code object for all current devices!"
已放弃 (核心已转储)

6.amd从入门到放弃:

放弃原因,后来rocm始终无法正确安装,后来在英文网站中找到原因,垃圾amd的rocm4.0放弃rx580显卡,需要更新的型号才能安装4.0,否则需要安装旧版本rocm,放弃了。。。

已放弃此方法,以后再看看吧

后来又遇到rocm支持5600XT等显卡,RX580需安装之前的rocm版本,我就放弃了,真麻烦,早知道直接nvdia 万岁

7. nvida回来评价,cuda安装真方便,入门真省事

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐