综合使用Ollama部署本地大模型

2024-11-19 10:00:55 +0800 CST views 2515

人工智能——使用Ollama部署本地大模型

1、简介

在如今的 AI 应用领域中，大模型（LLM，Large Language Models）已成为推动前沿技术发展的关键力量。其中的 Top1 当属 OpenAI 的 GPT 系列。通过大规模的数据训练，这些模型可以执行高质量的语言处理任务，如聊天问答、文本生成、翻译等。

去年，ChatGPT 引入了定制个人知识库的功能，采用了检索增强（RAG，Retrieval-Augmented Generation）技术。这一技术使得模型在生成回答前，先从知识库中检索相关信息，从而显著提高了输出的准确性和信息量。然而，由于网络环境、隐私和政策等限制，线上知识库的使用面临诸多挑战，越来越多人开始寻求部署本地大模型和知识库。

Ollama 的出现为本地部署带来了便利。Ollama 是一个大模型的管理框架，类似 Docker 的镜像管理方式，可以通过简单的命令快速拉取和运行大模型。

在本文中，我们将引导大家如何利用 Ollama 快速搭建本地大模型服务，并结合 MaxKB 构建一个私人定制的知识库。

2、优势

开源免费： Ollama 及其支持的模型完全开源免费，任何人都可以自由使用、修改和分发。
简单易用：无需复杂配置，只需几条命令即可启动和运行 Ollama。
模型丰富： Ollama 支持如 Llama 3、Mistral、Qwen2 等热门开源 LLM，并提供一键下载和切换功能。
资源占用低：即使在普通笔记本电脑上也能流畅运行。
社区活跃： Ollama 拥有庞大活跃的社区，用户可以轻松获取帮助、分享经验。

3、如何使用

安装 Ollama

根据你的操作系统，从 Ollama 官网下载并安装最新版本。

启动 Ollama

打开终端或命令行，输入以下命令启动 Ollama 服务器：

ollama serve

下载模型

在模型仓库中找到想要的模型，然后使用 ollama pull 命令下载：

ollama pull llama3:70b

运行模型

使用 ollama run 命令启动模型：

ollama run llama3:70b

开始聊天

在终端中输入你的问题或指令，Ollama 会根据模型生成相应的回复。

4、模型库

Ollama 支持多个模型，以下是一些可下载的示例模型：

Model	Parameters	Size	Command
Llama 3	8B	4.7GB	`ollama run llama3`
Llama 3	70B	40GB	`ollama run llama3:70b`
Mistral	7B	4.1GB	`ollama run mistral`
Dolphin Phi	2.7B	1.6GB	`ollama run dolphin-phi`
Code Llama	7B	3.8GB	`ollama run codellama`
Llama 2 Uncensored	7B	3.8GB	`ollama run llama2-uncensored`

5、安装Ollama

使用以下命令安装 Ollama：

curl -fsSL https://ollama.com/install.sh | sh

查看服务状态

systemctl status ollama

修改端口和模型存储位置

如果需要修改 Ollama 默认端口或模型存放路径，可编辑 /etc/systemd/system/ollama.service 文件：

[Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_MODELS=/data/ollama/models"

指定 GPU

如果使用 GPU，可以配置 CUDA_VISIBLE_DEVICES ：

Environment="CUDA_VISIBLE_DEVICES=0,1"

重启 Ollama：

systemctl daemon-reload
systemctl restart ollama

6、安装 MaxKB

MaxKB 是一款基于 LLM 的知识库问答系统，由飞致云开发。使用 Docker 部署 MaxKB：

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb

访问页面（默认账号：admin，密码：MaxKB@123..）。

7、导入模型

在 MaxKB 中，前往“系统管理” -> “模型设置” -> “Ollama”，添加模型，输入 API Key 后自动导入配置。

8、创建应用

在应用页面，点击“创建应用”，输入应用名称，关联模型，保存并发布。

images

复制全文生成海报人工智能机器学习软件开发

推荐文章

js正则验证人名，包含·（类似托儿.北科）

2024-11-19 05:56:23 +0800 CST

Vue3中的Suspense组件可以用来处理什么类型的操作？

2024-11-18 17:02:23 +0800 CST

Gin 与 Layui 分页 HTML 生成工具

2024-11-19 09:20:21 +0800 CST

前端项目中图片的使用规范

2024-11-19 09:30:04 +0800 CST

SpinKit，一款神奇的 CSS 开源加载动画旋转器

2024-11-19 07:42:22 +0800 CST

10个必备Go库：告别重复代码，提升开发效率

2025-08-21 14:14:07 +0800 CST

API 管理系统售卖系统

2024-11-19 08:54:18 +0800 CST

无感刷新 Token：打造“永不掉线”的丝滑用户体验

2025-08-15 15:23:36 +0800 CST

gin整合vfsgen进行打包静态static目录

2024-11-19 02:17:28 +0800 CST

原生JS判断手机与PC端：实现一个炫酷设备检测页面

2025-09-18 08:37:04 +0800 CST

Vue中的表单处理有哪几种方式？

2024-11-18 01:32:42 +0800 CST

踩坑浏览器节能机制导致Websocket断连的问题！

2024-11-19 05:31:36 +0800 CST

clia是一个用于处理命令行参数的Python库

2024-11-18 10:59:24 +0800 CST

告别Electron臃肿！用Pake将任何网页秒变轻量桌面应用

2025-08-26 07:05:06 +0800 CST

jQuery选择器：解锁HTML元素操作的强大工具

2024-11-17 23:06:18 +0800 CST

import 导入过的模块需要再次执行怎么办？

2024-11-18 11:04:52 +0800 CST

zerod是一个功能强大且高效的开源Python库，专为数据处理和机器学习设计

2024-11-18 20:43:14 +0800 CST

不止 `console.log`！5 个高效调试技巧，让你秒变前端排错高手

2025-08-16 08:36:18 +0800 CST

cssutils是一个强大的Python库，用于解析、修改和生成CSS样式表

2024-11-18 23:03:46 +0800 CST

jQuery中向DOM添加元素的多种方法

2024-11-18 23:19:46 +0800 CST

什么是 Vue 的服务端渲染（SSR）？它与客户端渲染的区别是什么？

2024-11-18 09:40:45 +0800 CST

PHP 8.4 中的新数组函数

2024-11-19 08:33:52 +0800 CST

Vue-Bag-Admin是一个基于Vue.js的开源管理系统前端框架

2024-11-19 03:48:35 +0800 CST

2024-11-18 08:32:19 +0800 CST

浏览器居然自带语音 API 和流处理 API！

2024-11-19 06:19:21 +0800 CST

Go语言SQL操作实战

2024-11-18 19:30:51 +0800 CST

PocketBase深度体验：一个文件搞定全栈开发，49.9K Star的后端神器

2025-09-04 12:52:55 +0800 CST

实现一个可以对数据列表进行筛选的功能

2024-11-18 18:49:14 +0800 CST

如何在Vue3中使用组合API创建一个简单的计数器？

2024-11-19 10:11:56 +0800 CST

Go 语言实现 API 限流的最佳实践

2024-11-19 01:51:21 +0800 CST

ZincSearch是一个轻量级的全文搜索引擎，能够替代Elasticsearch

2024-11-19 02:05:19 +0800 CST

企业官网案例-芊诺网络科技官网

2024-11-18 11:30:20 +0800 CST

AI 直播工具：Deep Live Cam 实时换脸效果超乎想象！附安装教程

2024-11-19 08:13:10 +0800 CST

Python中何时应该使用异常处理

2024-11-19 01:16:28 +0800 CST

Vue3 自定义 `ref` —— `customRef` 的使用

2024-11-18 10:05:40 +0800 CST

Golang 中你应该知道的 Range 知识

2024-11-19 04:01:21 +0800 CST

Rust 语言跨平台编译从入门到精通

2024-11-19 10:00:35 +0800 CST

一个名为“仙风道骨充值中心”的网页，提供用户充值游戏账户的功能

2024-11-19 04:50:17 +0800 CST

html5 输入密码时改键盘样式为数字键盘

2024-11-18 06:51:04 +0800 CST

现代前端存储利器：从 localStorage 到 IndexedDB

2025-08-15 16:07:03 +0800 CST

MySQL JSON字段避坑指南：这些场景用对效率翻倍！

2025-08-22 21:31:53 +0800 CST

网站被黑了怎么办？程序员手把手教你快速处理！

2024-11-18 01:48:01 +0800 CST

关于 `nohup` 和 `&` 的使用说明

2024-11-19 08:49:44 +0800 CST

使用HTML、CSS和JavaScript（Vue.js）构建的创意时钟

2024-11-18 14:26:16 +0800 CST

331K Star！API 开发神器，一站式搞定所有需求！

2025-03-12 18:38:10 +0800 CST

在 Rust 生产项目中存储数据

2024-11-19 02:35:11 +0800 CST

Sphinx-Watch是一个基于Sphinx的自动化文档生成工具

2024-11-19 02:28:05 +0800 CST

Gunicorn是一个高性能、易于使用的Python，适用于多种应用部署场景

2024-11-18 13:34:51 +0800 CST

Go语言中的`Ring`循环链表结构

2024-11-19 00:00:46 +0800 CST

使用Vue3和CompositionAPI实现图片拖拽上传功能。通过创建一个拖拽组件，用户可以直接将图片拖放到指定区域或通过按钮选择文件

2024-11-17 10:01:20 +0800 CST

综合 使用Ollama部署本地大模型