程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
猛涨25K Star!LLMFit:一键检测你的电脑能跑哪些大模型
案例
猛涨25K Star!LLMFit:一键检测你的电脑能跑哪些大模型
2026-05-06 07:35:19 +0800 CST
view 203
25K+Star的LLMFit一键检测你的电脑能跑哪些大模型,Rust编写支持NVIDIA/AMD/Intel/Apple Silicon,智能量化推荐Q8到Q2,四维评分系统,TUI+CLI双模式
LLM部署
硬件检测
量化推荐
Rust
终端工具
本地部署
Ollama
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
编程
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
2026-04-28 18:27:20 +0800 CST
view 274
基于Docker的自托管图片编辑器SnapOtter:45+工具、REST API接入AI Agent、本地AI修图(OCR/背景移除/高清化)、数据永久存NAS。海康智存部署教程。
Docker
NAS
图片处理
AI修图
本地部署
REST API
OpenClaw
Hermes
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 311
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
编程
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
2026-05-24 12:04:34 +0800 CST
view 63
Ollama v0.14.3 深度实战指南:从架构解析到生产部署,涵盖 GGUF 格式、API 集成、多模态模型、性能优化等核心内容,2026 年私有化大模型首选方案。
Ollama
大模型
本地部署
GGUF
多模态
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 446
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
编程
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
2026-05-28 16:37:41 +0800 CST
view 13
深入解析 Meta Llama 4 的 MoE 混合专家架构原理,探讨其如何以 17B 激活参数撬动万亿级算力,并提供完整的本地部署实战指南。
Llama4
MoE
混合专家
开源大模型
本地部署
Meta
人工智能
深度学习
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 246
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 194
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
编程
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
2026-04-09 07:55:23 +0800 CST
view 674
深度解析 METATRON:如何在本地零成本跑起一个完整的 AI 渗透测试助手,基于 Qwen 微调模型 + Ollama + MariaDB,无需 API Key,数据完全不出本地。
AI渗透测试
Ollama
Qwen
本地大模型
MariaDB
Pentest
安全工具
Agent
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
编程
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
2026-05-22 16:15:29 +0800 CST
view 168
Unsloth通过底层算子优化让大模型微调显存降低70%、速度提升2-5x,本文从原理到生产实战全方位拆解,含完整代码。
Unsloth
LoRA
QLoRA
大模型微调
本地训练
CLI Printing Press:火爆外网的Go开源神器!一键生成Agent专属CLI工具,45个开箱即用
案例
CLI Printing Press:火爆外网的Go开源神器!一键生成Agent专属CLI工具,45个开箱即用
2026-05-09 10:35:37 +0800 CST
view 290
CLI Printing Press:火爆外网的Go开源神器!给一个API地址或网站URL,自动生成专为AI Agent设计的Go CLI工具+MCP服务器+Claude Code Skill。内置五层创造力梯子(本地持久化→compound查询→行为洞察),比MCP token消耗少100倍。45个开箱即用的CLI库(espn/linear/flight-goat等),Go 1.26+即可使用。
Go
AI Agent
CLI
MCP
开源
Claude Code
SQLite
本地优先
API
Python
Rust
OpenClaw
discord
Linear
Stripe
GitHub
Notion
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 416
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
Rowboat 深度解析:当 AI 同事第一次拥有「长期记忆」,工作变成可积累的知识图谱
编程
Rowboat 深度解析:当 AI 同事第一次拥有「长期记忆」,工作变成可积累的知识图谱
2026-04-10 05:35:25 +0800 CST
view 352
Rowboat 是一个带长期记忆的开源 AI 同事,自动构建知识图谱,支持会议准备、文档生成、承诺追踪,采用本地优先架构,完全透明可控。
AI Agent
知识图谱
开源工具
本地优先
生产力工具
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 499
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 345
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
agents-cli:谷歌开源 AI Agent 全流程开发工具,从搭建到部署一键搞定
案例
agents-cli:谷歌开源 AI Agent 全流程开发工具,从搭建到部署一键搞定
2026-05-11 08:01:29 +0800 CST
view 177
谷歌云官方开源的 agents-cli 工具,专为简化 AI 智能体开发生命周期设计。支持 Gemini CLI、Claude Code、Codex、Cursor 等主流编程助手,内置七大技能包覆盖构建-评估-部署全流程,支持本地模拟评估、自动化部署到 Cloud Run/GKE、Gemini Enterprise 注册。
Google
agents-cli
AI Agent
CLI
部署
评估
ADK
Cloud Run
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
编程
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
2026-05-11 09:23:06 +0800 CST
view 207
Goose 是由 Block 开源、现已捐献给 Linux 基金会 AAIF 的本地 AI 编程代理。最新版本 v1.32.0(2026年5月6日)支持 Exa AI 搜索、桌面通知、@agent 协作、/skills 命令、自动压缩上下文、语音听写等功能。Rust 开发,支持 MCP 协议,可连接任何 LLM(OpenAI、Ollama、Kimi Code 等),完全本地运行无需订阅。
Goose
AI编程
本地LLM
MCP
Rust
Linux基金会
Block
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 113
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
Gunicorn是一个高性能、易于使用的Python,适用于多种应用部署场景
编程
Gunicorn是一个高性能、易于使用的Python,适用于多种应用部署场景
2024-11-18 13:34:51 +0800 CST
view 1950
Gunicorn是一个高性能、易于使用的PythonWSGIHTTP服务器,适用于多种应用部署场景。它支持多种工作模式,能够高效处理并发请求,并兼容多种PythonWeb框架。本文详细介绍了Gunicorn的安装方法、主要特性、基本和高级功能,以及实际应用场景,帮助开发者全面掌握该库的使用。
Python
Web开发
服务器
并发处理
应用部署
3MB就能跑PostgreSQL:PGlite如何用WebAssembly彻底改变前端数据库生态
编程
3MB就能跑PostgreSQL:PGlite如何用WebAssembly彻底改变前端数据库生态
2026-05-11 17:27:19 +0800 CST
view 151
PGlite将完整PostgreSQL编译为WebAssembly,在浏览器里跑真正的数据库。3MB gzip、无依赖、完整SQL支持、ACID事务、pgvector向量搜索。本文深度解析PGlite技术架构,并从零构建本地优先AI笔记应用实战。
PGlite
PostgreSQL
WebAssembly
前端数据库
WASM
本地优先
pgvector
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 319
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
里程碑!AI Agent 现在可以自己注册账号、购买域名、部署上线了
案例
里程碑!AI Agent 现在可以自己注册账号、购买域名、部署上线了
2026-05-04 07:37:15 +0800 CST
view 187
Cloudflare与Stripe合作推出Stripe Projects,让AI Agent可以自动完成账号创建、域名购买和应用部署,无需人工介入,标志着Agent能力边界的重要突破
Cloudflare
Stripe
AI Agent
自动化部署
无服务器
DevOps
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
编程
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
2026-05-18 06:15:03 +0800 CST
view 187
Redis之父antirez开源ds4.c项目深度解析:用纯C语言在MacBook上运行284B参数大模型,不对称2-bit量化、KV缓存磁盘化、OpenAI/Anthropic API兼容,打造首个真正的本地Agent推理后端
AI推理
本地大模型
Redis
Apple Silicon
DeepSeek
MTools:免费开源的本地 AI 工具集,一个顶好几个
编程
MTools:免费开源的本地 AI 工具集,一个顶好几个
2026-05-13 17:55:20 +0800 CST
view 144
MTools是一款完全本地运行的开源AI工具集,集成抠图、证件照制作、人声分离、音频转文字、视频插帧、超分辨率等功能,保护隐私且不限次数使用。
AI工具
本地运行
开源软件
图像处理
音频处理
视频处理
人声分离
抠图工具
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
下一页