这篇文章主要介绍“Linux下如何部署Ray集群”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Linux下如何部署Ray集群”文章能帮助大家解决问题。
Ray是UC Berkeley RISE Lab新推出的高性能分布式执行框架,它使用了和传统分布式计算系统不一样的架构和对分布式计算的抽象方式,具有比Spark更优异的计算性能。Ray是一个基于Python的分布式执行引擎。相同的代码可以在单个机器上运行以实现高效的多处理,并且可以在群集上用于大量的计算。
为了方便,我们最好利用 Anaconda构建来一个独立的python运行环境。(当然你也可以直接使用系统内python运行环境,那么你可以跳过此步骤)
# 下载安装脚本$ wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh# 添加执行权限$ chmod u+x Miniconda3-latest-Linux-x86_64.sh# 运行安装脚本$ ./Miniconda3-latest-Linux-x86_64.sh
为ray准备一个python环境,以python3.8.8示例:
# 创建一个名为ray,版本为3.8.8的python环境$ conda create --name ray python=3.8.8# 激活名为ray的python环境$ conda activate ray
安装完之后,最好重新登录一下,或者执行一下source ~/.bashrc
使得环境变量生效
安装ray(版本为1.7.0),这里为了加快速度指定了阿里的镜像源:
$ pip install -i https://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com -U 'ray[default]'==1.7.0
在192.168.100.1
上启动Head节点:
$ ray start --head --dashboard-host='0.0.0.0' --dashboard-port=8265
正常会看到如下输出:
Local node IP: 192.168.100.1 2021-11-02 18:33:11,977 INFO services.py:1250 -- View the Ray dashboard at http://192.168.100.1:8265 -------------------- Ray runtime started. -------------------- Next steps To connect to this Ray runtime from another node, run ray start --address='192.168.100.1:6379' --redis-password='5241590000000000'...
输出信息包含了2个关键信息,需要别注意:
View the Ray dashboard at http://192.168.100.1:8265
:web服务的地址ray start --address='192.168.100.1:6379' --redis-password='524159000'
:head的地址和密码在192.168.100.2
上,按照上面的步骤将python和ray安装好,注意它们的版本必须保持一致。 (另外,Worker不是必须的,因为Head节点本身就具有worker角色)
# 连接指定的Head地址$ ray start --address='192.168.100.1:6379' --redis-password='5241590000000000'
访问dashboard:http://192.168.100.1:8265
关于“Linux下如何部署Ray集群”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注亿速云行业资讯频道,小编每天都会为大家更新不同的知识点。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。