【ollama】(3):在linux搭建环境中,安装golang开发的ollama工具,并且完成启动下载gemma:7b和qwen:1.8b运行速度飞快,支持http接口和命令行模式

这篇具有很好参考价值的文章主要介绍了【ollama】(3):在linux搭建环境中,安装golang开发的ollama工具,并且完成启动下载gemma:7b和qwen:1.8b运行速度飞快,支持http接口和命令行模式。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1,视频地址

https://www.bilibili.com/video/BV19F4m1F7Rn/

【ollama】(3):在linux搭建环境中,安装ollama工具,并且完成启动下载gemma:7b和qwen:1.8b运行速度飞快,支持http接口和命令行

2,关于ollama项目

https://ollama.com/

项目使用golang+llama.cpp 项目进行开发的。
简化了模型的安装,非常的方便。

3,安装软件启动

curl -fsSL https://ollama.com/install.sh | sh

然后因为是docker 虚拟环境,需要手动启动服务: ollama serve

# ollama serve
time=2024-03-12T08:41:45.937+08:00 level=INFO source=images.go:710 msg="total blobs: 12"
time=2024-03-12T08:41:45.938+08:00 level=INFO source=images.go:717 msg="total unused blobs removed: 0"
time=2024-03-12T08:41:45.938+08:00 level=INFO source=routes.go:1021 msg="Listening on 127.0.0.1:11434 (version 0.1.28)"
time=2024-03-12T08:41:45.938+08:00 level=INFO source=payload_common.go:107 msg="Extracting dynamic libraries..."
time=2024-03-12T08:41:50.551+08:00 level=INFO source=payload_common.go:146 msg="Dynamic LLM libraries [rocm_v5 cpu rocm_v6 cpu_avx cuda_v11 cpu_avx2]"
time=2024-03-12T08:41:50.551+08:00 level=INFO source=gpu.go:94 msg="Detecting GPU type"
time=2024-03-12T08:41:50.551+08:00 level=INFO source=gpu.go:265 msg="Searching for GPU management library libnvidia-ml.so"
time=2024-03-12T08:41:50.554+08:00 level=INFO source=gpu.go:311 msg="Discovered GPU libraries: [/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.535.129.03 /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.535.98]"
time=2024-03-12T08:41:50.581+08:00 level=INFO source=gpu.go:99 msg="Nvidia GPU detected"
time=2024-03-12T08:41:50.581+08:00 level=INFO source=cpu_common.go:11 msg="CPU has AVX2"
time=2024-03-12T08:41:50.587+08:00 level=INFO source=gpu.go:146 msg="CUDA Compute Capability detected: 8.6"

然后启动 gemma:7b

ollama run gemma:7b

即可

ollama run gemma:7b 
>>> 北京景点
北京拥有众多各样的景点,每个景点都有其独特的魅力。以下列举了北京主要景点:

**历史文化景点:**

* **故宫博物院:** 世界上最大的古建筑群,包含皇帝的宫殿、殿宇和御用建筑等。
* **天安门广场:** 位于中央政府办公区,历史悠久的广场,拥有世界上最高建筑——国家领导人办公楼。
* **紫禁城:** 古代中国宫殿,为中国古代建筑的象征。
* **圆明园:** 元代皇家园林,包含众多古典建筑和雕塑。
* **北海寺:** 宏伟的佛教寺庙,拥有世界上最高佛塔。

**现代城市景观:**

* **天安门纪念堂:** 纪念中国共产党领导人毛泽东、朱列·刘备和马克思的纪念堂。
* **东方大厦:** 高度现代化的建筑,拥有世界上最高的摩天线。
* **国家博物馆:** 收藏中国古代艺术品和文物。
* **中国国家博物馆:** 展示中国古代艺术品的收藏。

**其他景点:**

* **国家森林公园:** 北京最大的公园,拥有美丽的自然风景和现代建筑。
* **华北新城:** 北京新开发的现代城市,拥有先进的科技和现代建筑。
* **北水库:** 位于北京北部的湖泊,拥有美丽的景色和完善的交通系统。

**建议的参观顺序:**

根据您的兴趣和时间,您可以根据以下顺序参观景点:

* 第一天:故宫博物院、天安门广场、紫禁城、北海寺。
* 第二天:圆明园、国家博物馆、中国国家博物馆。
* 第三天:国家森林公园、华北新城、北水库。

**注意事项:**

* 北京的交通系统比较便利,可以选择地铁、公交或出租车。
* 在参观景点时,建议提前购买门票,以节省时间和金钱。
* 北京的夏天比较热,建议在夏季穿轻便的衣服和使用防晒用品。
* 北京的冬天比较寒冷,建议在冬季穿保暖衣和使用保暖用品。

>>> Send a message (/? for help)

可以发现 支持中文效果也不错。

# nvidia-smi 
Tue Mar 12 08:44:02 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA GeForce RTX 3080        On  | 00000000:05:00.0 Off |                  N/A |
|  0%   26C    P8              14W / 320W |   6865MiB / 20480MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                                         
+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
+---------------------------------------------------------------------------------------+

ollama qwen1.8b,ollama,大模型,golang,linux,http,运维

3,支持多个模型推理

ollama qwen1.8b,ollama,大模型,golang,linux,http,运维

有切换的时间,模型会重新载入到显存。

4,还支持接口访问

curl http://localhost:11434/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "qwen:0.5b","stream":true,
        "messages": [
            {
                "role": "user",
                "content": "你好"
            }
        ]
    }'

curl http://localhost:11434/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "qwen:1.8b","stream":true,
        "messages": [
            {
                "role": "user",
                "content": "你好"
            }
        ]
    }'

curl http://localhost:11434/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "gemma:7b","stream":true,
        "messages": [
            {
                "role": "user",
                "content": "北京景点"
            }
        ]
    }'

模型存放地址

  • macOS: ~/.ollama/models
  • Linux: /usr/share/ollama/.ollama/models
  • Windows: C:\Users\<username>\.ollama\models

可以修改配置文件更改:文章来源地址https://www.toymoban.com/news/detail-849973.html

    OLLAMA_HOST       The host:port to bind to (default "127.0.0.1:11434")
    OLLAMA_ORIGINS    A comma separated list of allowed origins.
    OLLAMA_MODELS     The path to the models directory (default is "~/.ollama/models")

到了这里,关于【ollama】(3):在linux搭建环境中,安装golang开发的ollama工具,并且完成启动下载gemma:7b和qwen:1.8b运行速度飞快,支持http接口和命令行模式的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 搭建golang开发环境

    这里参考一篇文章: golang环境变量链接,还不错

    2024年02月15日
    浏览(30)
  • MacOS搭建golang开发环境

    使用homebrew安装golang。homebrew是MacOS 平台下的软件包管理工具,拥有安装、卸载、更新、查看、搜索等功能。开发者不需要关心依赖和文件路径。如果系统没有安装homebrew,终端内执行以下命令安装homebrew。 安装完homebrew后执行以下命令安装golang。 当然,也可以从go语言中文网

    2024年02月04日
    浏览(32)
  • 【Python入门篇】Python开发环境的搭建——安装和配置PyCharm工具

    作者简介: 辭七七,目前大一,正在学习C/C++,Java,Python等 作者主页: 七七的个人主页 文章收录专栏: Python入门,本专栏主要内容为Python的基础语法,Python中的选择循环语句,Python函数,Python的数据容器等。 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖💖 Python程序的开发有

    2024年02月04日
    浏览(36)
  • 使用一键安装工具快速搭建 ESP-IDF 开发环境 (Windows)

    我们收到用户对 ESP-IDF SDK 软件开发环境感到搭建难、门槛高的反馈。为解决用户在此方面的问题。为此,我们推出本期教程介绍在 Windows 操作系统下使用一键安装工具快速搭建 ESP-IDF 开发环境。 您可以观看下面的教程视频,也可以阅读接下来本篇的图文教程。 【乐鑫教程】

    2024年02月09日
    浏览(64)
  • Python学习笔记(1)--环境搭建,开发工具PyCharm 安装及初步使用

    传送门==B站黑马python入门教程 1.Python环境安装搭建 安装python基础包 首先,打开python 官网 https://www.python.org/ 下载windows版 下载后进行安装 默认下一步 可自定义安装位置,install安装即可 验证安装文件 win+R 输入cmd ,打开命令框,输入python,若看到安装版本,即安装成功 2.hello world 命令

    2024年02月11日
    浏览(36)
  • Docker Golang 开发环境搭建指南

    在 Golang 开发中,搭建合适的开发环境是非常重要的。然而,由于 Golang 的跨平台特性,不同操作系统之间的配置差异可能会导致环境搭建过程变得复杂。为了简化这个过程并保持开发环境的一致性,我们可以使用 Docker 来创建一个统一的 Golang 开发环境。 本文将介绍如何使用

    2024年02月03日
    浏览(47)
  • Golang开发环境搭建-Vim篇

    本文于2017年3月份完成,发布在个人博客网站上。 考虑个人博客因某种原因无法修复,于是在博客园安家,之前发布的文章逐步搬迁过来。 最近在研究docker的使用方法,恰好手边有一本docker源码分析的书,所以在ubuntu环境下准备了一套golang的开发环境,便于在学习docker使用的

    2024年02月04日
    浏览(30)
  • Golang环境搭建指南(Windows和linux)

    go语言和Java,Python,C语言等等基本一样,也是需要在系统内集成语言环境的。语言基本都一样,支持各种系统架构,比如,mac,Windows,linux系统支持。本文仅以最为常用的Windows和centos为例讲解go语言环境的搭建。 Downloads - The Go Programming Language 根据自己服务器的版本选择合适

    2024年02月13日
    浏览(40)
  • VMware虚拟机搭建 ESXI-8.0环境并且安装Mac OS13系统,

    官方下载地址 下载完成大小如下  打开VMware虚拟机 新建虚拟机     导入镜像,选择下载VMware-VMvisor-Installer-8.0b-21203435.x86_64.iso 开始进行安装  选择整块盘符安装 按回车键 键盘布局默认选择US-Default  设置root密码  按F11 进行安装 安装中(安装速度很快) 安装成功按回车重启

    2024年02月04日
    浏览(37)
  • windows下全免费手动搭建php8+mysql8开发环境及可视化工具安装

    最近PHP项目少了,一直在研究UE5和Golang,但是考虑到政府、国企未来几年国产化的要求,可能又要重拾PHP。于是近日把用了N年的框架重新更新至适合PHP8.2以上的版本,同时也乘着新装机,再次搭建php和mysql开发环境。本文留个记录,以后方便操作。 选择最新版下载 https://ww

    2024年01月20日
    浏览(71)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包