程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
编程
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
2026-05-24 12:04:34 +0800 CST
view 209
Ollama v0.14.3 深度实战指南:从架构解析到生产部署,涵盖 GGUF 格式、API 集成、多模态模型、性能优化等核心内容,2026 年私有化大模型首选方案。
Ollama
大模型
本地部署
GGUF
多模态
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 673
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 468
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
编程
2026大模型推理框架年度横评:vLLM/TGI/TensorRT-LLM/DeepSpeed-MII 架构深度解析与生产级选型指南
2026-06-18 17:54:54 +0800 CST
view 95
深度横评2026年四大主流大模型推理框架,涵盖PagedAttention架构、ContinuousBatching、算子融合、FP8量化、NVMe卸载等核心技术,配实测数据与生产级选型指南
大模型
LLM
推理框架
vLLM
TensorRT-LLM
TGI
DeepSpeed
GPU推理
AI部署
NVIDIA
嵌入式AI模型部署实战:从服务器到Arduino的模型压缩与优化指南
编程
嵌入式AI模型部署实战:从服务器到Arduino的模型压缩与优化指南
2026-05-13 17:55:43 +0800 CST
view 284
本文详细介绍如何将训练好的神经网络部署到Arduino、树莓派等嵌入式设备,涵盖模型量化、剪枝、知识蒸馏三大压缩技术,以及不同硬件平台的部署方案和实战经验。
嵌入式AI
模型部署
神经网络压缩
Arduino
树莓派
模型量化
实现系统的动态热部署功能,允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载
编程
实现系统的动态热部署功能,允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载
2024-11-18 20:57:45 +0800 CST
view 1570
本文讨论了如何实现系统的动态热部署功能,允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载。通过定义简单的计算器接口及其实现,展示了两种热部署方式:一种是通过反射加载Jar包,另一种是通过Spring上下文管理。还介绍了工具类DeployUtils的实现,提供了读取Jar包、判断SpringBean及生成Bean名称的方法,并提供了Jar包删除时同步删除SpringBean的代码示例。
Java
开发
热部署
Spring
编程
Cloudflare Workers AI 模型绑定深度剖析:从架构内幕到生产级部署的完整指南(2026)
编程
Cloudflare Workers AI 模型绑定深度剖析:从架构内幕到生产级部署的完整指南(2026)
2026-05-26 13:10:20 +0800 CST
view 274
深度剖析 Cloudflare Workers AI 的模型绑定机制、边缘推理架构内幕,以及生产级部署中最实用的优化策略与避坑指南。
Cloudflare
Workers AI
边缘计算
AI推理
Serverless
模型部署
低延迟
2026
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
2026-06-14 04:46:45 +0800 CST
view 185
深度解析 Google DeepMind Gemma 4 12B 的无编码器统一多模态架构,从原理到代码实战,涵盖 llama.cpp 部署、量化策略、Agent 工作流和生产级架构设计(2026)。
Gemma 4
Google DeepMind
多模态
本地部署
Agent
llama.cpp
开源大模型
MCP 2026 契约范式深度解析:OpenAPI 3.1+ 动态契约广播、Python 服务部署提速 300%、WebAssembly 性能优化
编程
MCP 2026 契约范式深度解析:OpenAPI 3.1+ 动态契约广播、Python 服务部署提速 300%、WebAssembly 性能优化
2026-05-14 03:40:17 +0800 CST
view 301
MCP 2026契约范式深度解析:动态契约广播gRPC-Web+SSE、结构化错误语义含恢复建议码、语义版本兼容性断言,以及Python MCP服务部署提速300%基于FastAPI+Rust扩展+WebAssembly。
MCP2026,契约范式,动态契约广播,OpenAPI3.1,Python服务部署,WebAssembly
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
编程
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
2026-05-28 16:37:41 +0800 CST
view 173
深入解析 Meta Llama 4 的 MoE 混合专家架构原理,探讨其如何以 17B 激活参数撬动万亿级算力,并提供完整的本地部署实战指南。
Llama4
MoE
混合专家
开源大模型
本地部署
Meta
人工智能
深度学习
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
编程
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
2026-06-20 01:25:22 +0800 CST
view 94
Ollama本地大模型生产级部署完全指南:从GGUF格式原理、INT4/INT8量化实战、REST API集成、多语言SDK(Python/Go/TypeScript)、GPU显存管理、Kubernetes+Helm生产部署、性能调优到RAG知识库构建,全流程深度实战。
Ollama
本地大模型
LLM部署
模型量化
GGUF
llama.cpp
REST API
Kubernetes
GPU
RAG
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
编程
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
2026-06-14 17:49:21 +0800 CST
view 212
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
Gemma 4 12B 工程实践:Encoder-Free 统一多模态架构从原理到本地部署完全指南(2026)
编程
Gemma 4 12B 工程实践:Encoder-Free 统一多模态架构从原理到本地部署完全指南(2026)
2026-06-14 17:49:38 +0800 CST
view 237
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
前端容器化实战:使用Docker高效部署前端项目的完整指南
编程
前端容器化实战:使用Docker高效部署前端项目的完整指南
2025-09-11 17:13:31 +0800 CST
view 1323
本文详细介绍了使用Docker容器化部署前端项目的完整实践指南。内容包括Docker环境安装、优化Dockerfile编写、多阶段构建、Nginx配置优化、DockerCompose管理、环境变量配置以及CI/CD自动化部署。提供了具体的代码示例和最佳实践,帮助开发者实现高效、一致的前端项目部署,提升部署效率和系统可靠性。
前端开发
容器技术
DevOps
部署优化
Web开发
Hermes Agent 深度实战:Nous Research 的自进化 AI 智能体——三层记忆、GEPA 引擎与生产级部署完全指南(2026)
编程
Hermes Agent 深度实战:Nous Research 的自进化 AI 智能体——三层记忆、GEPA 引擎与生产级部署完全指南(2026)
2026-05-29 03:38:44 +0800 CST
view 217
深度解析 Hermes Agent 的三层记忆架构、GEPA 自进化引擎、技能自生成机制,附带完整 Python 实战代码和生产级 Kubernetes 部署方案。
AI Agent
Python
自进化
三层记忆
GEPA
Nous Research
生产级部署
DeerFlow 2.0 深度实战:字节跳动70K Star的Super Agent Harness——从架构原理到生产级部署完全指南(2026)
编程
DeerFlow 2.0 深度实战:字节跳动70K Star的Super Agent Harness——从架构原理到生产级部署完全指南(2026)
2026-05-30 13:39:31 +0800 CST
view 201
2026年2月28日,字节跳动开源的DeerFlow 2.0登上GitHub Trending全球榜首,70K+ Star。本文从架构原理、核心组件、上下文工程、Docker沙盒安全机制、多智能体协作、MCP工具扩展、生产级部署等维度,全面解析这款让一个人就是一支AI军团的Super Agent框架。
DeerFlow
字节跳动
AI Agent
Super Agent
LangGraph
多智能体
Docker沙盒
上下文工程
生产级部署
Hermes Agent 深度实战:自进化 AI Agent 的架构设计与生产级部署完全指南(2026)
编程
Hermes Agent 深度实战:自进化 AI Agent 的架构设计与生产级部署完全指南(2026)
2026-05-30 16:41:27 +0800 CST
view 243
深入解析 Nous Research 开源的 Hermes Agent:六层核心架构、GEPA 自进化闭环、三层持久记忆系统、200+ 模型支持,以及从 $5 VPS 到 Modal Serverless 的完整生产级部署实战指南。
AI Agent
Hermes Agent
Nous Research
自进化
GEPA
Skill系统
生产部署
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 447
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 214
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
如何在生产环境中部署FastAPI应用程序
编程
如何在生产环境中部署FastAPI应用程序
2024-11-19 10:13:11 +0800 CST
view 2681
本文介绍了如何在生产环境中部署FastAPI应用程序,包括设置生产服务器、管理环境变量、使用反向代理和SSL/TLS加密等步骤。通过实际演示,读者可以学习如何使用Uvicorn和Gunicorn运行应用程序,配置Nginx作为反向代理,设置SSL/TLS证书,以及实现日志记录、中间件、CORS、速率限制和后台任务处理等功能,确保应用程序的安全性和性能。
Web开发
API
部署
安全性
性能优化
3.2万Star开源本地AI知识库:Open Notebook支持18家模型+播客生成+MCP集成
编程
3.2万Star开源本地AI知识库:Open Notebook支持18家模型+播客生成+MCP集成
2026-06-21 12:21:16 +0800 CST
view 40
Open Notebook 是3.2万Star的开源本地AI知识库,Google Notebook LM替代品。支持18家AI模型切换、1-4人播客生成、RAG对话+来源标注、MCP集成、REST API。MIT协议,Docker两分钟部署,数据全在本地。
AI知识库
开源
RAG
播客
MCP
Ollama
DeepSeek
本地部署
隐私
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 336
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
最小Loop:让Claude自己跑测试、修Bug,3个文件告别USB线工作流
编程
最小Loop:让Claude自己跑测试、修Bug,3个文件告别USB线工作流
2026-06-16 09:13:18 +0800 CST
view 106
最小Loop方案:用3个文件让Claude自己跑测试自己修Bug,CLAUDE.md循环协议+.claude/settings.json硬约束钩子+.claude/agents/fixer.md死局打破者,告别USB线工作流。
Claude Code
Claude Agent
AI编程
Loop工作流
自动测试
hooks
Fixer Agent
自动化
AI编码
10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器
综合
10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器
2024-11-19 09:36:25 +0800 CST
view 2482
无头浏览器是一种没有图形用户界面的Web浏览器,能够在后台执行任务,广泛应用于自动化测试、网络爬虫和数据抓取。它通过编程接口支持控制,提升测试效率并节省资源。主流工具包括Puppeteer、Selenium、Playwright等,适合在CI/CD流程中使用,但可能无法完全模拟真实用户体验。
开源工具
自动化
Web技术
测试
爬虫
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
9
下一页