程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Rowboat 深度解析:当 AI 同事第一次拥有「长期记忆」,工作变成可积累的知识图谱
编程
Rowboat 深度解析:当 AI 同事第一次拥有「长期记忆」,工作变成可积累的知识图谱
2026-04-10 05:35:25 +0800 CST
view 487
Rowboat 是一个带长期记忆的开源 AI 同事,自动构建知识图谱,支持会议准备、文档生成、承诺追踪,采用本地优先架构,完全透明可控。
AI Agent
知识图谱
开源工具
本地优先
生产力工具
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
编程
DiffusionGemma 深度实战:当 Google 用「扩散」颠覆自回归——从离散文本扩散原理到 MoE 架构、本地推理加速与生产级部署的完全指南(2026)
2026-06-16 18:52:52 +0800 CST
view 147
Google DeepMind联合NVIDIA发布DiffusionGemma——基于离散文本扩散的实验性开源模型。本文深入解读26B MoE架构、双向注意力机制、本地推理4倍加速原理,附完整代码示例和部署实战。
Google
DiffusionGemma
扩散模型
MoE
开源LLM
本地推理
AI推理加速
Ollama 深度实战:当本地大模型部署成为事实标准——从一行命令跑 Llama/Qwen/DeepSeek 到生产级 API 兼容与多语言接入完全指南(2026)
编程
Ollama 深度实战:当本地大模型部署成为事实标准——从一行命令跑 Llama/Qwen/DeepSeek 到生产级 API 兼容与多语言接入完全指南(2026)
2026-06-11 05:47:01 +0800 CST
view 205
本文深入讲解Ollama的原理、实战部署、性能优化,帮助开发者快速掌握本地大模型部署能力
Ollama
本地大模型
AI部署
Go语言
Python
ds4 深度实战:当 Redis 之父用纯 C 重写本地推理引擎——从 KV 缓存磁盘持久化到 Metal 极致优化的完全指南
编程
ds4 深度实战:当 Redis 之父用纯 C 重写本地推理引擎——从 KV 缓存磁盘持久化到 Metal 极致优化的完全指南
2026-06-11 07:51:35 +0800 CST
view 171
Redis之父antirez新作ds4深度解析:非对称2-bit量化、KV缓存磁盘持久化、Metal极致优化,284B模型在MacBook上跑出26 tok/s的完全指南
ds4
DeepSeek
本地推理
Metal
KV缓存
量化
antirez
Redis
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 675
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1301
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
编程
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
2026-05-11 09:23:06 +0800 CST
view 357
Goose 是由 Block 开源、现已捐献给 Linux 基金会 AAIF 的本地 AI 编程代理。最新版本 v1.32.0(2026年5月6日)支持 Exa AI 搜索、桌面通知、@agent 协作、/skills 命令、自动压缩上下文、语音听写等功能。Rust 开发,支持 MCP 协议,可连接任何 LLM(OpenAI、Ollama、Kimi Code 等),完全本地运行无需订阅。
Goose
AI编程
本地LLM
MCP
Rust
Linux基金会
Block
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
编程
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
2026-06-12 15:20:19 +0800 CST
view 206
从 2000 年前古希腊记忆术到 96.6% R@5 的 AI 本地记忆系统,深度解析 MemPalace 的 Wing/Room/Drawer 架构、可插拔后端设计与 MCP 集成实践
AI记忆
MemPalace
MCP
向量检索
RAG
本地部署
Python
AI Agent
3MB就能跑PostgreSQL:PGlite如何用WebAssembly彻底改变前端数据库生态
编程
3MB就能跑PostgreSQL:PGlite如何用WebAssembly彻底改变前端数据库生态
2026-05-11 17:27:19 +0800 CST
view 299
PGlite将完整PostgreSQL编译为WebAssembly,在浏览器里跑真正的数据库。3MB gzip、无依赖、完整SQL支持、ACID事务、pgvector向量搜索。本文深度解析PGlite技术架构,并从零构建本地优先AI笔记应用实战。
PGlite
PostgreSQL
WebAssembly
前端数据库
WASM
本地优先
pgvector
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
编程
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
2026-06-12 17:21:39 +0800 CST
view 115
2026年6月Google发布DiffusionGemma,首个生产级文本扩散大模型,本地推理速度提升4倍。本文深入剖析其从自回归到并行生成的架构革命,附完整代码实战。
DiffusionGemma
文本扩散
本地AI
Gemma
大模型推理
扩散模型
Python
Ollama
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
编程
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
2026-06-12 18:19:08 +0800 CST
view 176
深度解析 Redis 之父 antirez 最新开源项目 ds4(DwarfStar):一个纯 C 语言手写的 DeepSeek V4 Flash 本地推理引擎。从「窄而深」的工程哲学、非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 内核优化到实际部署,完整拆解这个 13K+ Star 项目的技术内幕。
AI推理引擎
DeepSeek
本地推理
系统编程
开源项目
C语言
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
编程
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
2026-05-24 12:04:34 +0800 CST
view 207
Ollama v0.14.3 深度实战指南:从架构解析到生产部署,涵盖 GGUF 格式、API 集成、多模态模型、性能优化等核心内容,2026 年私有化大模型首选方案。
Ollama
大模型
本地部署
GGUF
多模态
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 662
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
EchoBird百灵鸟:2.2K Star开源AI桌面客户端,一个工具搞定所有AI Agent的安装配置与管理
编程
EchoBird百灵鸟:2.2K Star开源AI桌面客户端,一个工具搞定所有AI Agent的安装配置与管理
2026-06-18 08:34:13 +0800 CST
view 128
EchoBird(百灵鸟)是2200+ Star的开源AI桌面客户端,基于Tauri+Rust,图形界面一键安装管理12+ AI Agent工具(Claude Code/Codex/OpenClaw/Aider等),Model Nexus统一配置模型,内置llama.cpp/vLLM本地推理引擎,一键启动本地大模型。
EchoBird
AI桌面客户端
Agent管理
Tauri
Rust
开源
本地大模型
AI工具管理
百灵鸟
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
编程
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
2026-05-18 06:15:03 +0800 CST
view 424
Redis之父antirez开源ds4.c项目深度解析:用纯C语言在MacBook上运行284B参数大模型,不对称2-bit量化、KV缓存磁盘化、OpenAI/Anthropic API兼容,打造首个真正的本地Agent推理后端
AI推理
本地大模型
Redis
Apple Silicon
DeepSeek
Gemma 4 12B 深度实战:当 Google 把多模态 AI「塞进」你的笔记本——从无编码器架构到本地 Agent 工作流的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把多模态 AI「塞进」你的笔记本——从无编码器架构到本地 Agent 工作流的完全指南(2026)
2026-06-13 12:46:40 +0800 CST
view 118
深度解析 Google DeepMind Gemma 4 12B 无编码器多模态架构,从架构原理到本地部署,从 Agent 工具链集成到生产级实战,5400+ 字完全指南。
Gemma 4 12B
Google DeepMind
多模态模型
本地推理
Agent
Ollama
无编码器架构
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
编程
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
2026-06-04 21:14:37 +0800 CST
view 168
深入剖析 Google AI Edge Gallery 的技术架构、Gemma 模型家族、端侧部署全流程,并通过完整代码示例,带你从零构建一个生产级本地 AI 应用。
Google AI Edge Gallery
本地AI
Gemma模型
端侧推理
Mac AI
Android AI
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
2026-06-05 04:13:34 +0800 CST
view 196
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
2026-06-05 04:13:52 +0800 CST
view 242
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
编程
MemPalace 深度实战:当《生化危机》女主学会 Vibe Coding——从记忆宫殿到生产级 AI 记忆系统的完全指南(2026)
2026-06-13 18:16:19 +0800 CST
view 96
深入剖析由《生化危机》女主Milla Jovovich开源的MemPalace AI记忆系统,探讨其逐字存储哲学、记忆宫殿隐喻、插件化后端设计、MCP协议接入,以及96.6% R@5高性能检索的实现原理。
AI记忆系统
MemPalace
向量数据库
RAG
MCP协议
本地优先
语义搜索
Odysseus 深度实战:当 YouTuber 之王用代码掀翻云端 AI 霸权——从自托管工作空间到生产级本地 Agent 的完全指南(2026)
编程
Odysseus 深度实战:当 YouTuber 之王用代码掀翻云端 AI 霸权——从自托管工作空间到生产级本地 Agent 的完全指南(2026)
2026-06-13 19:51:26 +0800 CST
view 263
PewDiePie开源的Odysseus自托管AI工作空间深度实战指南:从架构设计、LLM集成、Agent系统、记忆系统到安全架构的完全解析
Odysseus
自托管AI
PewDiePie
Agent
MCP
本地LLM
FastAPI
ChromaDB
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
编程
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
2026-06-13 20:17:57 +0800 CST
view 179
Redis之父antirez新作DwarfStar 4深度解析:专为DeepSeek V4 Flash打造的本地推理引擎,非对称2-bit量化、磁盘KV缓存、Metal图执行、分布式推理、方向引导,MacBook上284B模型跑出26 tok/s的完全指南
ds4
DwarfStar
DeepSeek
本地推理
Metal
MoE
量化
KV缓存
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
2026-06-14 04:46:45 +0800 CST
view 177
深度解析 Google DeepMind Gemma 4 12B 的无编码器统一多模态架构,从原理到代码实战,涵盖 llama.cpp 部署、量化策略、Agent 工作流和生产级架构设计(2026)。
Gemma 4
Google DeepMind
多模态
本地部署
Agent
llama.cpp
开源大模型
猛涨25K Star!LLMFit:一键检测你的电脑能跑哪些大模型
案例
猛涨25K Star!LLMFit:一键检测你的电脑能跑哪些大模型
2026-05-06 07:35:19 +0800 CST
view 365
25K+Star的LLMFit一键检测你的电脑能跑哪些大模型,Rust编写支持NVIDIA/AMD/Intel/Apple Silicon,智能量化推荐Q8到Q2,四维评分系统,TUI+CLI双模式
LLM部署
硬件检测
量化推荐
Rust
终端工具
本地部署
Ollama
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
下一页