type
status
date
slug
summary
tags
category
icon
password
comment_flag
SLUGS
安装
- 建议编译安装nccl。(在https://github.com/NVIDIA/nccl/tags下载)。
关于
NVCC_GENCODE
的获取(来源),执行如下shell脚本:- 添加NCCL_HOME环境变量(.zshrc中)。
- 跑通nccl-tests,见https://github.com/NVIDIA/nccl-tests,只有保证通过nccl-tests才可进行horovod安装,否则horovod不会被正确构建。
- 安装openmpi,archlinux发行版下,直接
sudo pacman -S openmpi
。编译安装可参考http://hmli.ustc.edu.cn/doc/mpi/openmpi-install.htm:
在
.zshrc
中添加:- 安装horovod:
- 在https://github.com/horovod/horovod/tree/master/examples下载demo来进行测试,如:
如果第6步显示:
根据https://github.com/NVIDIA/nccl/issues/631知道P2P不能正常启用可能会降低性能。解决方案:保证bios关闭了虚拟化(按照这个帖子检查是否开启了虚拟化),然后添加内核参数
iommu=pt
,重启。