创建简单的 Docker 数据科学映像

这篇具有很好参考价值的文章主要介绍了创建简单的 Docker 数据科学映像。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

推荐:使用NSDT场景编辑器快速搭建3D应用场景

为什么选择 Docker for Data Science?

作为一名数据科学家,拥有一个标准化的便携式分析和建模环境至关重要。Docker 提供了一种创建可重用和可共享的数据科学环境的绝佳方法。在本文中,我们将逐步介绍使用 Docker 设置基本数据科学环境的步骤。

为什么我们会考虑使用 Docker?Docker 允许数据科学家为他们的工作创建隔离且可重现的环境。使用 Docker 的一些主要优势包括:

  • 一致性 - 可以在不同的计算机上复制相同的环境。不再有“它适用于我的机器”的问题。
  • 可移植性 - Docker 环境可以轻松地跨多个平台共享和部署。
  • 隔离 - 容器隔离不同项目所需的依赖项和库。不再有冲突!
  • 可扩展性 - 通过启动更多容器,可以轻松扩展 Docker 内部构建的应用程序。
  • 协作 - Docker 通过允许团队共享开发环境来实现协作。

步骤 1:创建 Dockerfile

任何 Docker 环境的起点都是 Dockerfile。此文本文件包含有关生成 Docker 映像的说明。

让我们为 Python 数据科学环境创建一个基本的 Dockerfile,并将其保存为不带扩展名的“Dockerfile”。

# Use official Python image
FROM python:3.9-slim-buster

# Set environment variable
ENV PYTHONUNBUFFERED 1

# Install Python libraries 
RUN pip install numpy pandas matplotlib scikit-learn jupyter

# Run Jupyter by default
CMD ["jupyter", "lab", "--ip='0.0.0.0'", "--allow-root"]

这个Dockerfile使用官方的Python镜像,并在其上安装了一些流行的数据科学库。最后一行定义了在启动容器时运行 Jupyter Lab 的默认命令。

步骤 2:构建 Docker 镜像

现在我们可以使用以下命令构建映像:docker build

docker build -t ds-python .

这将创建一个基于我们的 Dockerfile 标记的图像。ds-python

生成映像可能需要几分钟时间,因为所有依赖项都已安装。完成后,我们可以使用 .docker images

步骤 3:运行容器

构建映像后,我们现在可以启动一个容器:

docker run -p 8888:8888 ds-python

这将启动 Jupyter Lab 实例,并将主机上的端口 8888 映射到容器中的 8888。

现在,我们可以在浏览器中导航到 Jupyter 并开始运行笔记本!localhost:8888

步骤 4:共享和部署映像

Docker 的一个关键优势是能够跨环境共享和部署映像。

要将图像保存到 tar 存档,请运行:

docker save -o ds-python.tar ds-python

然后,可以通过以下方式将此压缩包加载到安装了Docker的任何其他系统上:

docker load -i ds-python.tar

我们还可以将映像推送到 Docker 注册表(如 Docker Hub),以便在组织内公开或私下与其他人共享。

若要将映像推送到 Docker 中心,请执行以下操作:

  1. 创建一个 Docker 中心帐户(如果还没有)
  2. 使用 从命令行登录到 Docker Hubdocker login
  3. 使用您的 Docker Hub 用户名标记映像:docker tag ds-python yourusername/ds-python
  4. 推送镜像:docker push yourusername/ds-python

映像现在托管在 Docker Hub 上。其他用户可以通过运行以下命令拉取映像:ds-python

docker pull yourusername/ds-python

对于私有仓库,您可以创建组织并添加用户。这允许您在团队中安全地共享 Docker 映像。

步骤 5:加载和运行映像

要在另一个系统上加载并运行 Docker 映像,请执行以下操作:

  1. 将文件复制到新系统ds-python.tar
  2. 使用 加载图像docker load -i ds-python.tar
  3. 使用 启动容器docker run -p 8888:8888 ds-python
  4. 访问 Jupyter 实验室localhost:8888

就是这样!ds-python 映像现在可以在新系统上使用了。

结语

这为您提供了使用 Docker 设置可重现的数据科学环境的快速入门知识。需要考虑的一些其他最佳做法:

  • 使用较小的基础映像(如 Python slim)来优化映像大小
  • 利用 Docker 卷实现数据持久性和共享
  • 遵循安全原则,例如避免以根用户身份运行容器
  • 使用 Docker Compose 定义和运行多容器应用程序

我希望这个介绍对您有所帮助。Docker为简化和扩展数据科学工作流程提供了大量可能性。

原文链接:创建简单的 Docker 数据科学映像 (mvrlink.com)文章来源地址https://www.toymoban.com/news/detail-694438.html

到了这里,关于创建简单的 Docker 数据科学映像的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Docker数据管理和镜像创建

    管理Docker容器中数据主要有两种方式:数据卷(Data Volumes)和数据卷容器(DATa Volumes Containers)。 数据卷是一个供容器使用的特殊目录,位于容器中。可将宿主机的目录挂载到数据卷上,对数据卷的修改操作立刻可见,并且更新数据不会影响镜像,从而实现数据在宿主机与容

    2024年02月15日
    浏览(31)
  • docker 创建oceanbase数据库

    docker 快速创建oceanbase数据库 ##docker拉取oceanbase镜像 docker pull obpilot/oceanbase-ce ##docker启动oceanbase容器 docker run -itd -m 10G -p 2881:2881 -p 2883:2883 --name oceanbase-ce obpilot/oceanbase-ce ##进入oceanbase容器 docker exec -it oceanbase-ce bash ##obclient客户端使用租户集群密码连接proxy 2883 数据库 oceanbase o

    2024年01月24日
    浏览(29)
  • 简单认识Docker数据管理

    因为数据写入后如果停止了容器,再开启数据就会消失,使用数据管理的数据卷挂载,实现了数据的持久化,重启数据还会存在;还有一种方式,容器之间共享文件即相当于有个备份,也会解决停止容器后数据消失的问题。 管理 Docker 容器中数据主要有两种方式:数据卷(

    2024年02月12日
    浏览(40)
  • Docker 的数据管理、容器互联、镜像创建

    目录 一、数据管理 1.数据卷 2. 数据卷容器 二、容器互联(使用centos镜像) 三、Docker 镜像的创建 1.基于现有镜像创建 1.1首先启动一个镜像,在容器里修改 1.2将修改后的容器提交为新的镜像,需使用该容器的id号创建新镜像 2.基于本地模板创建 2.1下载模板文件生成镜像  2

    2024年02月16日
    浏览(50)
  • docker 镜像的创建dockerfile 和数据卷

    基于现有的镜像创建镜像 docker commit 基于模板创建镜像 模板可以从OPENVZ开源项目下载 基于dockerfile创建 Docker镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)

    2024年02月09日
    浏览(34)
  • Docker 的数据管理与Dockerfile 镜像的创建

    ------------------Docker 的数据管理--------------------- 管理 Docker 容器中数据主要有两种方式:数据卷(Data Volumes)和数据卷容器(DataVolumes Containers)。 1.数据卷 数据卷是一个供容器使用的特殊目录,位于容器中。可将宿主机的目录挂载到数据卷上,对数据卷的修改操作立刻可见

    2024年02月07日
    浏览(30)
  • Linux6.12 Docker 数据管理和镜像的创建

    第四章 LINUX Docker 数据管理和镜像的创建 一、Docker 的数据管理 管理 Docker 容器中数据主要有两种方式:数据卷(Data Volumes)和数据卷容器(DataVolumes Containers) 1.数据卷 数据卷是一个供容器使用的特殊目录,位于容器中。可将宿主机的目录挂载到数据卷上,对数据卷的修改操

    2024年02月16日
    浏览(29)
  • ubuntu中如何用docker下载华为opengauss数据库(超简单)

    openGauss 是一款全面友好开放,携手伙伴共同打造的企业级开源关系型数据库。openGauss采用木兰宽松许可证v2发行,提供面向多核架构的极致性能、全链路的业务、数据安全、基于AI的调优和高效运维的能力。openGauss深度融合华为在数据库领域多年的研发经验,结合企业级场景

    2024年02月08日
    浏览(31)
  • JAX: 快如 PyTorch,简单如 NumPy - 深度学习与数据科学

    JAX 是 TensorFlow 和 PyTorch 的新竞争对手。 JAX 强调简单性而不牺牲速度和可扩展性。由于 JAX 需要更少的样板代码,因此程序更短、更接近数学,因此更容易理解。 长话短说: 使用 import jax.numpy 访问 NumPy 函数,使用 import jax.scipy 访问 SciPy 函数。 通过使用 @jax.jit 进行装饰,可

    2024年02月03日
    浏览(43)
  • 注意避坑:centos7官方版镜像不支持arm架构(docker请求的映像的平台(linux/aamd64)与检测到的主机平台(linux/alm64/v8)不匹配)fauria/vsftpd

    注意是centos7 docker官方版镜像不支持arm架构(FROM centos:7),不是centos7不支持arm 今天基于fauria/vsftpd在我们的arm盒子上做了个docker镜像,但是用镜像run容器的时候提示: 翻译就是: 警告:请求的映像的平台(linux/aamd64)与检测到的主机平台(linux/alm64/v8)不匹配,并且没有请求

    2024年02月08日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包